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Abbildung 1: Ausschnitt des Komnenus-Mosaiks (1122-1134), Hagia So- 
phia, Istanbul; Fotograf: Myrabella, http://commons.wikimedia.org/wiki/ 
User:Myrabella 


Filme und Videos setzen sich aus vielzähligen Einzelbildern zusammen, 
welche ihrerseits wieder aus Millionen winziger Bildpunkte bestehen. In 
gewisser Weise können sie damit als Metamosaike aufgefasst werden. Die 
frühesten illustrativen Mosaike entstanden um 100 v. Christus in Pompeji. 
Ihre Hochblüte erreichte die Mosaikkunst im byzantinischen Reich (Abb. 1). 
Der Bildausschnitt zeigt die Repräsentation von Irene (Frau des byzantini- 
schen Kaisers Johannes II. Komnenus), die eine versiegelte Schriftrolle in 
den Händen hält (Qantara, 2013). Im metaphorischen Sinne verweist dies auf 
den Dokumentsinn von Filmen und Videos, der im McLuhan’schen Sinne 
nicht nur im Inhalt bzw. der „Botschaft“, sondern schon im Medium selbst — 
d.h. in dessen formaler Komposition (insb. Montage und Farbkontraste) — 
enthalten ist. 
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Einleitung 


In seinem Buch „Die Kunst der Farbe“ vergleicht der Bauhauskünstler, 
Kunsttheoretiker und Kunstpädagoge Johannes Itten (2000, 2010) seine Tä- 
tigkeit als Lehrer mit der eines „Wagenbauers“'. Mittels seines theoretisch 
inspirierten Erfahrungswissens, seiner durch Praxis erworbenen Fertigkeiten 
und anhand von ausgewähltem Fallmaterial möchte er einen möglichst „nütz- 
lichen Wagen [...] bauen, der allen eine Hilfe sein soll [...], um rasch und 
sicher vorwärtszukommen“ (Itten, 2000, S. 11, 2010, S. 7). Zur einführenden 
Erklärung des Ziels dieses Buches könnte es kein passenderes Gleichnis 
geben. Auch mir geht es im Wesentlichen darum, dass meine Überlegungen 
für die Arbeiten anderer brauchbar sind und deren Entwicklung beschleuni- 
gen. Im Unterschied zu Itten möchte ich jedoch keinen eigenen „Wagen“ 
bauen, d. h. keine eigene Methodologie entwickeln, sondern vielmehr einen 
bereits bestehenden „Wagen“ tunen: Im Rahmen dieser Arbeit zum Thema 
Videointerpretation sehe ich meinen Beitrag in der Demonstration von Tech- 
niken und Erweiterungsmöglichkeiten für die Methodologie der dokumenta- 
rischen Methode. Dabei bewegen mich vor allem Fragen der Leistungsfähig- 
keit der Video- und Filminterpretation nach dieser Methode. 

Anhand ausgewählter Fallbeispiele möchte ich in diesem Zusammenhang 
vorhandene methodisch-technische und metatheoretische Grenzen ausloten. 
Denn nur, wenn man die Grenzen des Verfahrens kennt, lassen sich auch 
Strategien zu deren Überwindung entwickeln. Zugleich geht es mir um die 
empirische Exploration möglicher Erweiterungen, die zur Erschließung zu- 
sätzlicher Erkenntnispotentiale im Rahmen der dokumentarischen Video- und 
Filminterpretation geeignet sind. Die diesbezüglichen metatheoretischen 
Überlegungen sind vor allem auf meine Sozialisierung als Kultur- und Medi- 
enpsychologe zurückzuführen. Nach der Grundauffassung der Kultur- und 
Medienpsychologie sind Menschen und Medien nicht als voneinander ge- 
trennt anzusehen, sondern bilden füreinander wechselseitige Kontexte, in 
denen sie sich gemeinsam dynamisch konstituieren (Slunecko, 2008). 

Zusammenfassend sind für mich sowohl das Aufdecken konkreter me- 
thodischer und forschungspraktischer Grenzen der dokumentarischen Video- 
und Filminterpretation als auch die metatheoretische Reflexion ihrer For- 
schungslogik in einem interdisziplinären Diskurs als wesentliche Bausteine 
einer lebendigen Auseinandersetzung mit diesem Verfahren anzusehen. Zu- 
gleich möchte ich nicht vergessen darauf hinzuweisen, wie relevant das freie 


1 Itten (2000, S. 11) beruft sich dabei auf ein Gleichnis aus der „Veda“, dem ältesten Teil der 
indischen Literatur (ca. 1500-2000 v. Chr.): „Alles, was man aus Büchern oder von seinen 
Lehrern lernen kann, ist gleich einem Wagen“. „Veda“ bedeutet auf Sanskrit auch „Wis- 
sen“ und auf Hindi „Wissenschaft“. 
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Experimentieren mit Fallmaterial zur Entwicklung kreativer Problemlösun- 
gen ist. Damit meine ich nicht nur die passive analytische Einklammerung 
des Geltungscharakters des Verfahrens, sondern tatsächlich den aktiv und 
bewusst vollzogenen Rollenwechsel vom/von der rein forscherischen Be- 
trachter/in zum/zur aktiven Gestalter/in von Fall- bzw. Videomaterial. Dieser 
kleine Schritt kann für jene Psycholog/inn/en und Sozialforscher/innen eine 
Herausforderung darstellen, welche es aufgrund einer eher klassisch-quanti- 
tativen Methodenausbildung gewohnt sind sich selbst als „unbeteiligte Drit- 
te“ im Forschungsprozess anzusehen. Demgegenüber kann und soll sich 
der/die Forscher/in im Rahmen rekonstruktiver Sozialforschung (Bohnsack, 
2007) gerade nicht aus dem Spiel nehmen. Die entweder gedankenexperi- 
mentelle oder tatsächliche Variation bzw. Gestaltung von Fallmaterial durch 
die Forscher/innen stellt ein wichtiges Erkenntnisinstrument dar. Das Ver- 
fahren der Dokumentarischen Methode folgt dabei der erkenntnistheoreti- 
schen Überzeugung Mannheims (2003), dass Forscher/innenhandeln immer 
,standortgebunden“ ist und sogar nur aus dieser „Standortgebundenheit“ 
heraus überhaupt Fallmaterial erhoben werden kann. Anstelle sich also der 
Illusion hinzugeben, „keinen“ Beitrag zu den erhobenen Daten geleistet zu 
haben, empfiehlt Bohnsack (2007) die genaue Kontrolle und empirische 
Rekonstruktion? des eigenen Forscher/innenverhaltens und -wissens, das zur 
Hervorbringung der Daten unmittelbar beigetragen hat. In diesem Sinne birgt 
die proaktive Gestaltung des Fallmaterial durch die Forscher/innen (im Sinne 
von dessen De- und Rekontextualisierung) wertvolle Impulse zur Entwick- 
lung empirischer Suchstrategien sowie eines tieferen empirisch-theoretischen 
Verständnisses. Die konkrete Umsetzung des Vorgehens sowie die genauen 
Erkenntnispotentiale der damit im Zusammenhang stehenden kultur- bzw. 
medienpsychologischen Überlegungen werde ich in der Folge anhand empiri- 
scher Fallbeispiele erläutern. 

Zur Auswahl des Fallmaterials ist in diesem Zusammenhang festzuhal- 
ten, dass sie sowohl nach methodologischen als auch inhaltlichen Überlegun- 
gen getroffen wurde. Aus methodologischer Sicht wurden Fernsehshows und 
Musikvideos ausgewählt, weil beides hochgradig erfolgreiche Produkte des 
professionell-kommerziellen Unterhaltungssektors sind, in denen sich die 
Leistungen umfangreicher und vielschichtiger Produktionskollektive doku- 
mentieren. Des Weiteren erreichen populäre Fernseh- bzw. Videoformate 
offensichtlich weite Publikumskreise. Laut Quotenmeter (2004) erzielte die 
Fernsehshow „Istanbul Total“ (Kap. 5 und 6) am 10. Mai 2004, d.h. bereits 
am ersten Sendetag, alleine in Deutschland eine Einschaltquote von 2,13 
Mio. Zuseher/inne/n, was überdurchschnittlichen 10,8 Prozent Marktanteil 
entspricht. Der Song des in dieser Arbeit untersuchten Musikvideos „Araba“ 


2 Im Sinne eines „methodisch kontrollierten Fremdverstehens“ (Bohnsack, 2007). 
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(Kap. 8) war 1996 in der Türkei so populär, dass er acht Jahre später als 
„Neuverfilmung“ (Kap. 10) nochmals auf den internationalen Markt kam. 
Zugleich lassen sich im Fallmaterial von Fernsehshows und Musikvideos 
auch unterschiedliche Produktionsbedingungen nachweisen (in Kap. 7.4 gibt 
es einen eigenen Exkurs dazu), was spannende Herausforderungen für die 
Auswertung nach dem Verfahren der dokumentarischen Video- und Filmin- 
terpretation mit sich bringt. 

Wenngleich der konkrete Inhalt der einzelnen Videos für die Betrach- 
tungsweise dieser Arbeit an sich von sekundärer Bedeutung ist, habe ich in 
meiner Präsentation dennoch auf eine gewisse thematische Einheit des Fall- 
materials geachtet. Der Hintergrund dieser Vorgehensweise ist zum einen, 
den inhaltlichen Fokus soweit konstant zu halten, dass über die Fallbeispiele 
hinweg ein Vergleich der Interpretationsschritte und Materialarten möglich 
wird. Zum anderen kann das Fallmaterial aber auch als eine Art Echo des 
Beginns dieser Forschungsarbeit gesehen werden, als mein Erkenntnisinte- 
resse noch stärker von inhaltlichen Überlegungen getrieben war. Die deut- 
sche Fernsehshow „Istanbul Total“ stellte ursprünglich mein erstes mit der 
dokumentarischen Methode untersuchtes Videomaterial dar. Am Anfang 
interessierte mich diesbezüglich die Frage der kultur- und medienspezifi- 
schen Herstellungsbedingungen von Deutschem und Türkischem im Fernse- 
hen.” In diesem Buch ist die inhaltliche Rekonstruktion des Fallmaterials 
(„Istanbul Total“ sowie andere Videos) jedoch nur so weit von Belang, als 
dadurch ein Beitrag zum Verständnis der formalen Durchführung der Inter- 
pretationsschritte sowie zu den jeweiligen Erweiterungen der Methodologie 
der dokumentarischen Methode zu erwarten ist. 

Im ersten Kapitel dieser Arbeit stelle ich die methodologische Grundpo- 
sition der Video- und Filminterpretation nach der dokumentarischen Methode 
sowie zentrale Begriffe vor. Eine detailliertere Begriffsklärung erfolgt sowohl 
in den theoretischen Folgekapiteln als auch im Zusammenhang mit konkreten 
Fallbeispielen im empirischen Teil der Arbeit. Im zweiten Kapitel widme ich 
mich in einem theoretischen Zugang der methodologischen Herausforderung 
der Montage. Die Montage wird seitens der Filmwissenschaft als das zentrale 
Alleinstellungsmerkmal von Videos und Filmen angesehen, hat in der Psy- 
chologie und den Sozialwissenschaften jedoch noch nicht diesen Stellenwert 
erreicht. Im dritten Kapitel gehe ich auf das technische Erfordernis sowie die 
Möglichkeiten der Videotranskription ein. Dabei stelle ich zum einen das 
Transkriptionssystem MoViQ und zum anderen die verschiedenen Einsatz- 
möglichkeiten der Videotranskription dar. Diese beinhalten nicht nur neue 


3 Anhand der Eingangspassage von „Istanbul Total“ fertigte ich auch mein erstes Videotran- 
skript (Hampl, 2005, 2006) an. Dieses wird im Kapitel 3 vorgestellt. Im Anhang dieser Ar- 
beit finden sich außerdem noch eine Dokumentation der Vorarbeiten und Interpretationsan- 
sätze von damals. 
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Möglichkeiten zur Darstellung, sondern auch zur Auswahl und Interpretation 
von Videomaterial. Im vierten Kapitel ziehe ich ein Zwischenfazit der 
(meta-)theoretischen Überlegungen. Des Weiteren erläutere und begründe ich 
die Auswahl des Fallmaterials. Mit dem fünften Kapitel beginnt der ei- 
gentliche empirische Teil der Arbeit, wobei ich meine methodologischen 
Überlegungen anhand der konkreten Auswertung von Fallmaterial vorstelle. 
Im Wesentlichen ist der empirische Teil als mehrstufige komparative Analyse 
und Methodentriangulation konzipiert. Zu Beginn geht es mir darum, die 
Leser/innen mit den interpretativen Möglichkeiten des Mediums Video ver- 
traut zu machen. Der Einstieg erfolgt daher zuerst durch die Präsentation 
einiger konkret am Fallmaterial entwickelter Instrumente. Im Rahmen der 
Methodentriangulation wird die Interpretation der Eingangspassage der Fern- 
sehshow „Istanbul Total“ (erster Sendetag) anhand einer Montage-, Einstel- 
lungs- und Gesten- bzw. Gebärdenvariation durchgeführt. Im Anschluss 
daran stellt das sechste Kapitel sowohl einen minimalen inhaltlichen Kontrast 
als auch eine methodische Vertiefung dar. Am zweiten Sendetag der Fernseh- 
show „Istanbul Total“ wird ein Ausschnitt aus der türkischen Beyaz-Show 
gezeigt. Als „Show in der Show“ wird diese fokussierte Sequenz für die 
komparative Analyse ausgewählt und nach den von Bohnsack (2009) für die 
Film- und Videointerpretation beschriebenen Arbeitsschritten sowohl in der 
Bild- als auch in der Textdimension detailinterpretiert. Im siebten Kapitel 
werden die zentralen Orientierungsrahmen und Abgrenzungshorizonte der 
Sendung „Istanbul Total“ in komparativer Analyse mit touristischen Reisevi- 
deos über die Stadt Istanbul herausgearbeitet. Des Weiteren wird im Rahmen 
einer abschließenden Kontextanalyse auf die die ökonomischen Verflechtun- 
gen der an der Produktion der Sendung beteiligten Unternehmen und Perso- 
nen eingegangen. Im Vergleich zu Fernsehshows wird im achten Kapitel die 
mediale Gattung Musikvideos vorgestellt. Im neunten Kapitel wird das Mu- 
sikvideo „Araba“ interpretiert, das den größten Erfolg in der Karriere des 
türkischen Sängers Mustafa Sandal darstellt. Am dritten Sendetag der Fern- 
sehshow „Istanbul Total“ hat Mustafa Sandal eine Neuauflage seines Mu- 
sikvideos für den internationalen Markt vorgestellt. Im zehnten Kapitel er- 
folgt daher die komparative Analyse der beiden Musikvideos, von denen das 
eine für den türkischen und das andere für den internationalen Markt produ- 
ziert wurde. Beide Videos erzählen auf der Bildebene jeweils unterschiedli- 
che Geschichten. Das elfte Kapitel beinhaltet schließlich die abschließende 
Diskussion der Arbeit. 
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Abbildung 2: Animal locomotion. Plate 44 (Ausschnitt), Fotograf: Eadweard 
Muybridge (2009) 


Die Bildinterpretationslehre des Kunsthistorikers Erwin Panofskys (2006) 
zählt zur Metatheorie der dokumentarischen Methode der Bild- und Videoin- 
terpretation. In einem viel zitierten Beispiel bezieht sich Panofsky auf die 
Geste des Hutziehens, um damit die Systematik seines analytischen Vorge- 
hens zu erläutern. Der Fotograf Eadweard Muybridge (2009) hat die Geste 
des Hutziehens 1887 fotographisch erstmals in eine Sequenz von Einzelbil- 
dern zerlegt. Aus heutiger Sicht können die so entstandenen Bewegungsstu- 
dien als Frühform der Videotranskription angesehen werden (Abb. 2). 


1 Videomaterial und Methodologie der 
dokumentarischen Methode 


Die Grundidee, sich im Rahmen dieser Arbeit an die Auseinandersetzung mit 
methodologischen Fragen sowie an mögliche Erweiterungen heranzuwagen, 
beruht auf der Entstehungsgeschichte der dokumentarischen Video- und 
Filminterpretation selbst. Das Verfahren existiert nunmehr seit einigen Jahren 
(Bohnsack, 2009; Erstausgabe: 2008) und ist ursprünglich als Erweiterung 
der Methode der Bildinterpretation entstanden. Die auf Bohnsack zurückge- 
hende Bildinterpretation nach der dokumentarischen Methode (Bohnsack, 
2009) ist derzeit, neben der visuellen Wissenssoziologie (Breckner, 2010; 
Raab, 2008), einer der vielversprechendsten Interpretationsansätze, der für 
die Psychologie nutzbar gemacht werden kann. Sie zeichnet sich durch einen 
hohen Grad an theoretischer Durchdringung des Gegenstands Bild, durch 
Klarheit und Systematik der Arbeitsschritte sowie durch empirische Prüf- 
instrumente zur methodischen Kontrolle des Common Sense der For- 
scher/innen aus.” Im Zusammenhang mit dem Verfahren der Video- und 
Filminterpretation nach der dokumentarischen Methode möchte ich in der 
Folge auf einige zentrale Begriffe eingehen, die für das Grundverständnis der 
Methodologie erforderlich sind. Weiterführende Begrifflichkeiten und Kon- 
zepte werden im weiteren Verlauf der Arbeit direkt anhand von Fallmaterial 
erläutert. 


1.1 Fernsehshows und Musikvideos als öffentliche 
Alltagsdokumente 


Wie der Titel dieser Arbeit erkennen lässt, beschränkt sich meine Auseinan- 
dersetzung mit dem Verfahren der Video- und Filminterpretation auf Kul- 
turdokumente der sogenannten Massenkommunikation: Fernsehshows und 
Musikvideos. Diese Medien sind insbesondere aufgrund der dahinterliegen- 
den, weitgehend anonymen Produzent/inn/en/kollektive von Interesse. Dabei 
folge ich der grundsätzlichen Einteilung Bohnsacks (2009, S. 117), der Filme 
bzw. Videos auf einer ersten Ebene in Erhebungsinstrumente und Alltagsdo- 
kumente einteilt. Auf der zweiten Ebene dann lassen sich Alltagsdokumente 


4 Letzteres kann als methodologisches Manko der nomothetischen Psychologie (Valsiner, 
Molenaar, Lyra, & Nandita, 2009) angesehen werden. Ähnlich wie bislang den Cultural 
Studies (Bohnsack, 2009, S. 125) gelingt auch ihr keine systematische Unterscheidung von 
Common Sense und wissenschaftlicher Interpretation. 
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nochmals in Produkte des privaten und in solche des öffentlichen Bereichs 
differenzieren. Fernsehshows und Musikvideos sind demnach als Alltagsdo- 
kumente des öffentlichen Bereichs anzusehen und können auf empirischem 
Wege prinzipiell sowohl mittels Produkt- als auch mittels Rezeptionsanaly- 
sen untersucht werden. Während Rezeptionsanalysen in der Psychologie eine 
lange Tradition haben, sind Produktanalysen eher selten. Dieses Ungleichge- 
wicht hat unter anderem mit dem bisherigen Fehlen geeigneter Instrumente 
zur direkten systematischen Rekonstruktion von Medien- und Kulturproduk- 
ten zu tun. Die Video- und Filminterpretation nach der dokumentarischen 
Methode wurde dazu entwickelt, diese Lücke zu schließen. 


1.2 Ikonik: Die Eigensinnigkeit der Bilder 


Laut Bohnsack (2009, S. 51) liegt die größte Besonderheit bildlicher Medien 
darin, komplexe Sinngehalte im Modus der Gleichzeitigkeit hervorzubringen. 
Dabei sind Bilder und Videos in der Lage, auf simultane Weise Wider- 
sprüchlichkeiten zu fassen, ohne die resultierenden Spannungen zwischen 
Differenz und Synthese in eine bestimmte Richtung hin auflösen. Diese spe- 
zielle Medieneigenschaft von Bildern hat Imdahl (1996) als „Übergegensätz- 
lichkeit“ bezeichnet. Just aus dem Zwischenzustand von Entweder und Oder 
generieren Bilder ihre ikonische Energie und Wirkung. Nach Bohnsack 
(2009) ist die Vermittlung dieses ikonischen Sinns im Medium der Sprache 
oder des Textes nur annäherungsweise und mit großem Aufwand realisier- 
bar. Bohnsacks programmatische Forderung ist es deshalb, sich im Bereich 
der Methodenentwicklung der „Eigensinnigkeit von Bildern“ (Bohnsack, 
2009, S. 32) anzunehmen. Für die Rekonstruktion der spezifischen Simultan- 
struktur von Bildern schlägt Bohnsack (2009) nach dem Verfahren der do- 
kumentarischen Methode ein Prozedere vor, das Panofskys (2006) und Im- 
dahls (1996) kunstwissenschaftliche Bildtheorien auf der Basis ihrer wissens- 
soziologischen Wurzeln für den Anwendungsbereich der empirischen Sozial- 
forschung nutzbar macht. Aus methodologischer Sicht stützt sich das Verfah- 
ren der dokumentarischen Methode, in vergleichbarer Weise wie die objek- 
tive Hermeneutik, auf die ,,Leitdifferenz“ (Bohnsack, 2009, S. 19) von im- 
manentem Sinn und Dokumentsinn. 


5 Die Struktur von Text und Sprache ist im Wesentlichen eine sequenzielle, wobei Slunecko 
(2008) mit McLuhan (1992) darauf hinweist, dass der Text gegenüber der oralen Sprache 
noch ein zusätzliches Maß an Distanzierung mit sich bringt. Bei Slunecko (2008) finden 
sich jedoch auch Hinweise, wie die Entwicklung der Schriftlichkeit die Bildwahrnehmung 
kulturhistorisch im Sinne eines stärker „widererkennenden Sehens“ vorbereitet. 
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1.2.1 Wiedererkennendes und sehendes Sehen 


Nach Bohnsack (2009, S. 56) ist der erste Arbeitsschritt bei der Interpretation 
von (Stand-)Bildern im Sinne Panofskys (2006) die vorikonografische bzw. 
ikonografische Interpretation. Dabei sind die wiedererkennbaren Bildbe- 
standteile des Vorder-, Mittel- und Hintergrunds in einfachen Worten zu 
beschreiben und kulturspezifische Wissensbestände zu explizieren. Zusam- 
menfassend bezeichnet Bohnsack (2009) diesen Interpretationsabschnitt als 
formulierende Interpretation. Das erklärte Ziel dieses Vorgehens ist es, den 
Inhalt des Bildes, das Was, möglichst konkret und intersubjektiv überprüfbar 
in ein textliches Abbild zu überführen. 

Im Zuge der anschließenden reflektierenden Interpretation erfordert der 
folgende Arbeitsschritt die Suspendierung bzw. „Einklammerung“ (Bohn- 
sack, 2007, S. 163; Mannheim, 2003, S.88) des gerade wiedererkannten 
Bildinhalts. Im Sinne des „sehenden Sehens“ (Imdahl, 1996) soll nun der 
Blick auf die planimetrische Komposition des Bildes gerichtet werden, wel- 
che laut Bohnsack (2009, S. 40) die eigentlich bedeutsame Ebene zum Ver- 
ständnis der Ikonik von Bildern sei. 


1.2.2  Planimetrische Komposition 


Unter der planimetrischen Komposition eines Bildes wird nach Imdahl 
(1996) seine Flächenstruktur verstanden. Bei der Rekonstruktion ist das Bild 
als Ensemble verschiedener Formen, Farben, „Gewichte“, „Spannungen“ zu 
verstehen, welche die Blickrichtung leiten und unterschwellig die Aufmerk- 
samkeit der Bildbetrachter/innen auf sich ziehen. Ziel der Rekonstruktion 
dieser Ebene ist die Entwicklung eines Zugangs zur formalen Grundstruktur 
des Bildes, welche sich stets in Form einer „Übergegensätzlichkeit“ (Imdahl, 
1996) im Bild dokumentiert. 

Die Rekonstruktion der planimetrischen Komposition ist für Ungeübte 
insofern voraussetzungsreich, als sie, wie bereits zuvor erwähnt, auf dem 
sehenden Sehen aufbaut. Entsprechend seiner metatheoretischen Fundierung 
ist das sehende Sehen zwar für den Alltag in hohem Maße handlungsleitend, 
jedoch nicht ohne weiteres bewusst verfügbar. In der Regel wird im Alltag 
das wiedererkennende Sehen als die einzige Form des Sehens verstanden. 
Das sehende Sehen kann jedoch durch das Betrachten gegenstandsloser bzw. 
abstrakter Kunst geübt werden. 
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1.2.3 Sehendes Sehen und gegenstandslose Kunst 


Abbildung 3: „Schwarzes Quadrat auf weißem Grund“, Kasimir Malewitsch, 
1915 


Besonders ergiebig zur Einübung des sehenden Sehens erscheinen die bildne- 
rischen Gestaltungstheorien des staatlichen Bauhauses, einer Kunstschule, 
die 1919 von Walter Gropius gegründet wurde und bis 1933 bestand. Die 
Künstler/innen des Bauhauses (etwa: Malewitsch, Kandinsky, Itten etc.), 
ihres Zeichens Vertreter/innen der Avantgarde bzw. klassischen Moderne, 
waren Zeitgenoss/inn/en von Karl Mannheim und Erwin Panofsky und beste- 
chen sowohl aufgrund ihrer eigenen Kunstproduktion als auch wegen des 
hohen Grades an theoretischer Durchdringung ihrer künstlerischen Überle- 
gungen. Da die Gestaltungsprinzipien der Bauhauskünstler/innen weitgehend 
in schriftlich publizierter Form sowie als eigene Bilder vorliegen, lassen sie 
sich für die rekonstruktive qualitative Bildforschung nutzbar machen. Insbe- 
sondere Ittens (2000, 2010) „Kunst der Farbe“ sowie Kandinskys „Punkt und 
Linie zu Fläche“ (1986)° bieten überaus konkrete Anhaltspunkte dafür, wie 


6 Erstver6ffentlichung: 1926 
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sich die planimetrische Komposition im Sinne Imdahls rekonstruieren lässt, 
und erscheinen damit in hohem Maße als Arbeitsschritte der dokumentari- 
schen Bildinterpretation geeignet.” Aus metatheoretischer Sicht hat Male- 
witsch (1994)* die Auseinandersetzung mit dem Bild maßgeblich beeinflusst, 
indem er es von seiner Abbildungsfunktion befreit hat. 

Eine Entsprechung der Imdahlschen Konzeption der planimetrischen 
Grundstruktur des Bildes, die durch das „sehende Sehen“ bestimmt sei, findet 
sich in Kasimir Malewitschs suprematistischem Manifest über „die gegen- 
standslose Welt“ (Malewitsch, 1994) aus dem Jahre 1922. Für Imdahl 
(1994, S.316) erweist sich erst am Bildmaterial der „gegenstandslosen 
Kunst“ die wahre Überlegenheit seines Konzepts der Ikonik gegenüber Pa- 
nofskys Ikonografie und Ikonologie. In Panofskys Ansatz lassen sich gegen- 
standslose Bilder (z. B. Abbildung 3) zwar beschreiben und in eine Stilge- 
schichte einordnen, jedoch bleibt auf dieser Ebene deren eigentlicher Bild- 
sinn, die Ikonik, welche auf der Planimetrie beruht, verschlossen. Für das 
wiedererkennende Sehen ist ein schwarzes Quadrat nichts weiter als ein 
schwarzes Quadrat. Erst die empirische Berücksichtigung des sehenden Se- 
hens ermöglicht es, die formalen Strukturierungsangebote des Bildes genauer 
zu erfassen und auf diesem Wege die damit verbundenen kulturgeschichtli- 
chen Grundbedingungen des Wiedererkennens zu rekonstruieren. Wissen- 
schaftlich gesehen müssen wir uns letztlich fragen, was dieses Quadrat über- 
haupt so selbstverständlich hervortreten lässt. Schon eine erste planimetrische 
Betrachtung zeigt, dass wir dafür die kognitive Leistung erbringen müssen, 
den weißen Rand auszublenden, der das Quadrat umgibt. Rein planimetrisch 
betrachtet ist die Leinwand des Bildes in exakt gleichem Ausmaß schwarz, 
wie sie weiß ist.’ Durch die Rekonstruktion der Planimetrie erhalten wir 
folglich Aufschluss über uns selbstverständlich gewordene Sehgewohnheiten 
— gewissermaßen die Standards der visuellen bzw. ,,ikonischen Kommunika- 
tion“! (Przyborski & Slunecko, 2011, 2013). Im Sinne „methodisch kontrol- 


7 Im Sinne einer empirisch-theoretischen Durchdringung des Planimetriekonzepts erscheinen 

auch die Texte der Bauhauskünstler Klee (1990) und Malewitsch (1994) sowie des japani- 

schen Designtheoretikers Kenya (2009) für die rekonstruktive Bildforschung von zentraler 

Bedeutung. 

Erstveröffentlichung: 1927 

Der weiße Bilderahmen ist dabei gar nicht mit eingerechnet. 

10 Wie sich mit Kenya (2009), Krämer (1998), Slunecko (2008) sowie Slunecko und Przy- 
borski (2009) zeigen lässt, kann im vorliegenden Bild (Abbildung 1) nur dann etwas wahr- 
genommen werden, wenn es gleichzeitig gelingt, das Trägermedium mit zu erfassen und 
dadurch „unsichtbar zu machen“ (Krämer, 1998). Kenya (2009) erklärt, wie sich die ur- 
sprüngliche Trägereigenschaft des Papiers, als Hintergrund darauf gemalter oder geschrie- 
bener Information, in der asiatischen und westlichen Welt sukzessive auf die Farbe Weiß 
übertragen und damit kultur- und mediengeschichtlich zu deren Unsichtbarwerden beige- 
tragen hat. Slunecko und Przyborski (2009) erläutern anhand des Beispiels eines marokka- 
nischen Berberteppichs, in den westliches Millimeterpapier eingewoben ist, die kulturellen 
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lierten Fremdverstehens“ (Schütze, Meinefeld & Weymann, 1973) bietet 
uns erst dieser Schritt die Möglichkeit, die Alltagswahrnehmung empirisch 
sauber vom Fallmaterial zu unterscheiden. 

Die abstrakte Kunst verweist in fokussierter und direkter Weise auf die 
spezifische Eigensinnigkeit des Bildes, die durch kein anderes Medium er- 
setzt werden kann. Im Vergleich zum Kunsthistoriker Imdahl, der seine Bild- 
interpretationen auf dem ontologischen Verhältnis von „sehendem Sehen“ 
und „wiedererkennendem Sehen“ aufbaut, erörtert der Kunstschaffende Ma- 
lewitsch die Modi der Bildauffassung noch grundsätzlicher auf der Ebene 
von „Gegenständlichkeit“ und „Gegenstandslosigkeit“. In seinem Sinne 
bleibt der Zugang zur Ikonik des Bildes jedoch nicht nur dem wiedererken- 
nenden Sehen verwehrt, sondern entzieht sich prinzipiell jedem gegenständli- 
chen Bildverständnis, das rein verstandesmäßig am „Praktischen“, „Wirt- 
schaftlichen“ und „Nützlichen“ orientiert ist.!! 

In Hinblick auf die Entwicklung empirischer Instrumente zur Rekon- 
struktion des „sehenden Sehens“ (Imdahl, 1996) bzw. der „Gegenstandslo- 
sigkeit“ (Malewitsch, 1994) sind nicht nur Malewitschs Schriften, sondern 
insbesondere seine Bilder von hoher Relevanz. Laut Imdahl „steckt die Leis- 
tung eines jeden Bildes von Rang in der Erschaffung einer solchen stellver- 
tretenden Repräsentationsform, die in ihrer Augenscheinlichkeit nur als das 
System eines Bildes bestehen und somit selbst durch nichts anderes vertreten 
werden kann“ (1994, 5.319). Malewitschs wohl bedeutendstes Werk, 
„Schwarzes Quadrat auf weißem Grund“ (Abbildung 3), ist in diesem Sinne 
zu Recht zu einer Ikone der „Gegenstandslosigkeit“ geworden. Bildimmanent 
fordert es das „wiederkennende Sehen“ sowie den Common Sense heraus 
und öffnet sich zugleich für das „sehendes, Sehen“, welches das Bild in sei- 
ner Bildlichkeit anerkennt.'? 

Zusammenfassend lässt sich von einem zweifachen Nutzen der gegen- 
standslosen Kunst für die empirische Forschung sprechen: Zum einen schult 
sie den forscherischen Blick auf das Bild, zum anderen bietet sie taugliche 
Mittel zu dessen Interpretation an. Indem sie sich dem Common Sense ent- 
zieht, erlaubt sie das Einüben einer auf die spezifische Medialität des Bildli- 
chen eingestellten Untersuchungshaltung. Indem sie ihre eigene Gestaltungs- 


Missverständnisse, die entstehen, wenn das konventionalisierte Unsichtbarmachen des Trä- 
germaterials misslingt. 

11 In diesem Sinne können Malewitschs Schriften auch als Kritik am wissenschaftlich- 
psychologischen Mainstream verstanden werden. Die Forderung nach „Gegenstandslosig- 
keit“ ist letztlich auch ein Aufruf gegen die „Vergegenständlichung“ bzw. „Reifizierung“ 
(Przyborski & Slunecko, 2009). 

12 Malewitschs Titel „Schwarzes Quadrat auf weißem Grund“ macht diesen Gedanken sogar 
explizit zum Thema. Das schwarze Quadrat wird vergegenständlicht. Man hat den Titel des 
Bildes jedoch erst verstanden, wenn man das Bild „sehend“ erfasst und seine Übergegen- 
sätzlichkeit verstanden hat. 
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praxis reflektiert und anleitet, bietet sie wertvolle Ansatzpunkte und Instru- 
mente, die für die empirische Forschung brauchbar sind. In weiterer Folge 
möchte ich im Hinblick auf die Interpretation der planimetrischen Struktur 
von Bildern insbesondere auf die Arbeiten von Itten (2000, 2010) eingehen, 
dessen Farbkontrasttheorie ich als unmittelbar geeignet für die Bild- und 
Videointerpretation nach der dokumentarischen Methode ansehe. 
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Abbildung 4: One Week Skin (ESPN-Hs), Archival Inkjet Print, 70” x 53”. 
Ed. 7 + 2 APs, Künstler: Jason Salvon (2012), Quelle: http://salavon.com/ 
work/one-week-skin/image/405/ 


Im Bereich der Bildinterpretation liegen die Erkenntnisräume von Kunst und 
Wissenschaft oft nahe bei einander, ja manchmal überlappen sie sich sogar. 
Ein gutes Beispiel, in dem sich solch eine Überlappung manifestiert, ist die 
Arbeit „One Week Skin“ des amerikanischen Künstlers Jason Salvon (Abb. 
4.). Das abgebildete Farbraster erinnert formal stark an den Aufbau eines 
Videotranskripts. Tatsächlich handelt es sich jedoch um die künstlerische 
Transformation von Fernsehaufzeichnungen, nach folgendem Algorithmus: 


“[One week skin is a] suite of large print-works sourcing and abstracting 
exactly one week of specific pay-TV networks at 15 frames per second. 
These millions of ordered, discrete images are reformatted using various 
graphic, sequential, and data-visual approaches. The three different reformu- 
lations (or “skins”) of network streams each lay equal claim to accurately 
representing (“visualizing”) the captured TV matter. Perhaps this emphasizes 
a contradictory sense of both truth and arbitrariness in the formal manifesta- 
tions.“ (Salavon, 2012) 
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2 Montage 


Neben der Entwicklung verschiedener methodologischer Ansätze zur Bildin- 
terpretation (etwa: Bohnsack, 2009; Breckner, 2010; Przyborski & Slunecko, 
2011, 2013) sind in den Sozialwissenschaften während der letzten Jahre auch 
einige Konzepte zur Interpretation von Filmen und Videos entstanden (etwa: 
Bohnsack, 2009; Dinkelaker & Herrle, 2009; Raab, 2008). Eines der me- 
tatheoretisch und empirisch elaboriertesten Verfahren stellt die Film- und 
Videointerpretation nach der dokumentarischen Methode dar (Bohnsack, 
2009), die sich forschungspraktisch bis heute im Zusammenhang mit zahlrei- 
chen Fragestellungen und Fallmaterialien bewähren konnte (Baltruschat, 
Bohnsack & Pfaff, 2010; etwa: Baltruschat, 2010; Bohnsack, 2009; Hampl, 
2010; Sobotka, 2009). 

Mit der zunehmenden Etablierung der Methode der Film- und Videoin- 
terpretation in den Sozialwissenschaften ist jedoch nicht nur ein Mehr an 
empirischen Fallstudien zu erwarten, sondern auch eine steigende methodo- 
logische Auseinandersetzung, zu der diese Arbeit einladen möchte. Bei nähe- 
rer Betrachtung der bisherigen Forschungsarbeiten, die mithilfe der Film- und 
Videointerpretation nach der dokumentarischen Methode entstanden sind, 
fällt eine besondere Schwerpunktsetzung auf die Interpretation von Foto- 
grammen, d.h. von Standbildern, auf. Die Interpretation von Fotogrammen 
ist im Rahmen der dokumentarischen Methode metatheoretisch gut begründet 
und stützt sich sowohl auf die wechselseitige Validierung (Bohnsack, 2009, 
S. 155) mit anderen ausgewählten Standbildern eines Films bzw. Videos als 
auch auf die Interpretation des Sprechtextes. Somit lassen sich durch die 
Relationierung der Fotogramme in der dokumentarischen Methode die Er- 
gebnisse auf ihre Gültigkeit hin überprüfen. „Homologien“ oder „Struk- 
turidentitäten“ bestehen laut Bohnsack (2009, S. 165) jedoch auch in den 
„Relationen der Einstellungen zueinander“ — in der Montage. Erst durch den 
systematischen Vergleich der Interpretationen auf der Ebene der Fotogramme 
und der Montage werden daher die Potentiale der dokumentarischen Methode 
— im Sinne einer „Relationierung der beiden Relationen“ (Bohnsack, 2009, 
S. 165) — wirklich ausgeschöpft. Dieser Aspekt wurde in der Forschungspra- 
xis und bei der Methodologieentwicklung bisher eher vernachlässigt. 

Indem ich mich in dieser Arbeit den Phänomenen in der Bilddimension 
von Videos und Filmen genauer zuwende, komme auch ich nicht umhin, 
gewisse Punkte im Rahmen meiner metatheoretischen Betrachtung einzu- 
klammern. Dabei handelt es sich um die Tondimension von Videos und Fil- 
men sowie die wechselseitige Referenz von Ton- und Bilddimension. Die 
diesbezüglich laut Bohnsack (2009) erforderlichen Arbeitsschritte zur Inter- 
pretation des Ton- bzw. Textraums werden in Kapitel 6 zwar anhand des 
empirischen Fallmaterials einer Fernsehshow genauer vorgestellt. Eine sys- 
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tematische Reflexion der Bedeutung der Tondimension für die Montage kann 
jedoch im Rahmen dieser Arbeit nicht geleistet werden. Mein vorrangiges 
Erkenntnisinteresse ist die Klärung der Verhältnisse zwischen Bildern und 
bewegten Bildern in der Bilddimension. Erst auf Basis dieser Erkenntnisse 
kann meiner Ansicht nach die methodologische Miteinbeziehung der Tondi- 
mension in differenzierter Weise erfolgen. 


2.1 Begriffsdefinitionen 


Der Fokus dieses Kapitels liegt auf der Rekonstruktion der Montage bzw. den 
damit zusammenhängenden Leistungen der Bildproduzent/inn/en. Der Be- 
griff der Montage lässt sich von seiner sprachlichen Entstehungs- und film- 
wissenschaftlichen Verwendungsgeschichte her erläutern. Ursprünglich 
stammt das Wort Montage aus dem Französischen und bezeichnet prinzipiell 
jegliche Art des mechanischen Zusammenbauens. Die technische Aufladung 
des Begriffs wurde mit dem Aufkommen der Filmtechnologie auf das Zu- 
sammenkleben einzelner Filmstreifen übertragen. Im deutschen Sprachraum 
wird synonym zur Montage das Wort Schnitt verwendet. Auch dieser Begriff 
betont die technische Seite der Filmherstellung, wobei damit genau genom- 
men das Gegenteil von „Montage“, nämlich das Auseinanderschneiden von 
Filmstreifen, bezeichnet wird. 

In dieser Arbeit findet eine weiter gefasste Definition von Montage Ver- 
wendung, welche die rein mechanische Betrachtung überschreitet. Diese 
Definition stammt aus der Film- und Fernsehwissenschaft (etwa: Mikos, 
2003) und begegnet uns auch bei der Übersetzung von „Montage“ ins Engli- 
sche: Der Begriff editing” leitet sich aus der Bearbeitung und Herausgabe 
von Texten ab und schließt neben der mechanischen auch die künstlerische 
Gestaltung von Filmmaterial mit ein. Im Hinblick auf die empirische Unter- 
suchung von Filmen und Videos entspricht diese Auffassung den Überlegun- 
gen von Bohnsack (2009, S. 159) und Mikos (2003), welche die Montage als 
Vorgang der mechanischen und ästhetischen Gesamtkomposition ansehen. 
Aus methodologischer Sicht wird somit unter Montage nicht nur das techni- 
sche Zusammenfügen einzelner Einstellungen zu Sequenzen verstanden, 
sondern auch die effektive „Herstellung narrativer und ästhetischer Struktu- 
ren durch diesen technischen Vorgang“ (Mikos, 2003, S. 207). 

Als Einstellung bezeichnet Bohnsack (2009, S. 159) kontinuierlich auf- 
genommene Filmstücke, welche ihrerseits aus zeitlich geordneten Einzelbild- 


13 Analog zum Deutschen ist im Englischen neben „editing“ auch das Wort „cutting“ ge- 
bräuchlich. 
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folgen bestehen. In Abgrenzung zur Montage ist laut Bohnsack (2009, 
S. 159) eine Einstellung „so lange gegeben, wie kein Schnitt erfolgt“. Wäh- 
rend sich die Einstellung im Rahmen der Standbildfotografie rein durch die 
Wahl des Kamerastandpunkts sowie des Bildausschnitts bzw. der Einstel- 
lungsgröße definiert, kommen bei Film und Video die Kamerabewegungen 
hinzu (Bohnsack, 2009, S. 160). Dazu zählen sowohl Kamerafahrten und - 
schwenks als auch Vergrößerungen bzw. Verkleinerungen des Bildaus- 
schnitts. 

Die Begriffe Szene und Sequenz sind in ihrer filmwissenschaftlichen 
Verwendung nicht einheitlich voneinander abgegrenzt. Laut Bohnsack (2009, 
S. 160) handelt es sich in beiden Fällen um filmische Einheiten, die aus der 
Verbindung „einer oder mehrerer Einstellungen“ entstehen. Als Unterschei- 
dungsmerkmal kann nach Monaco (2009) die Länge dieser Einheiten dienen: 
„Sequenzen sind sicherlich länger als Szenen [...] (Monaco, 2009, S. 171). 
Bohnsack (2009, S. 161) schlägt für die sozialwissenschaftliche Analyse 
jedoch eine inhaltliche Differenzierung vor, die sich aus der Differenzierung 
abbildender und abgebildeter Bildproduzent/inn/en ergibt. Bei genauerer 
Betrachtung orientiere sich der Begriff der Szene eher an den Personen oder 
Objekten vor der Kamera, also den Leistungen der abgebildeten Bildprodu- 
zent/inn/en, während sich Einstellung und Montage auf die Leistungen der 
abbildenden Bildproduzent/inn/en, also der Personen hinter der Kamera, 
beziehen. Damit ist im Sinne Bohnsacks (2009) der Begriff der Sequenz 
dafür geeignet, die erwähnten filmischen Einheiten in sich aufzunehmen: 
„Beides zusammen — also der Zusammenhang von Szene einerseits und Ein- 
stellung und Montage andererseits — konstituieren eine Sequenz“ (Bohnsack, 
2009, S. 161). 


2.2 Der methodologische Stellenwert der Montage 


Für das Verfahren der Film- und Videointerpretation nach der dokumentari- 
schen Methode ist die Rekonstruktion der Montage nach Bohnsack (2009, 
S. 158) insbesondere aus zwei Gründen von Interesse: Zum einen stellt die 
Montage, vom Standpunkt der zeitgenössischen (etwa: Mikos, 2003; Wiede- 
mann, 2005) sowie zum Teil auch der klassischen Filmwissenschaft (etwa: 
Pudowkin, 1999) aus gesehen, das wesentlichste Alleinstellungsmerkmal des 
Mediums Film bzw. Video dar. Laut Aussage des Filmregisseurs Stanley 


14 Laut Flusser (1997, S. 91) gibt es einen wesentlichen Unterschied zwischen Fotografen und 
Kameramännern/-frauen: ,,[D]er Fotograf und sein Apparat erzeugen die Fotografie, wäh- 
rend der Kameramann mit seiner Kamera nur das Rohmaterial für die spätere Erzeugung 
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Kubrick ist „[d]ie Montage [...] der einzige Vorgang, bei dem der Film keine 
Anleihen bei anderen Künsten“ macht (Kubrick, zitiert bei Schumm, 2004, 
S. 167). Zum anderen dokumentierten sich, wie bereits erwähnt, in der Mon- 
tage die exklusiven Leistungen der abbildenden Bildproduzent/inn/en, was 
wesentliche Konsequenzen für die Interpretation mit sich bringe: Während 
bei der Untersuchung von Fotogrammen stets ebenso die Leistungen der 
abgebildeten Bildproduzent/inn/en, d. h. der Personen vor der Kamera, be- 
rücksichtigt werden müssen, stellt die Montage „eindeutig das Produkt der 
abbildenden Bildproduzent/inn/en dar“ und eröffnet „uns den Zugang zu 
deren modus operandi“ (Bohnsack, 2009, S. 162). 

In diesem Zusammenhang kann aus der Perspektive der Forschungspra- 
xis argumentiert werden, dass der Stellenwert der Rekonstruktion der Mon- 
tage mit der Art des verwendeten Fallmaterials zusammenhängt. Für die 
Interpretation von Filmen und Videos, die von den Forscher/inne/n selbst zu 
Studienzwecken erstellt wurden und bei denen somit die Leistungen der ab- 
gebildeten Bildproduzent/inn/en im Vordergrund stehen, spielt die Rekon- 
struktion der Montage in der Regel eine sekundäre Rolle.'° Für die Interpreta- 
tion von solchen Filmen oder Videos, die bereits als Alltagsdokumente vor- 
liegen — insbesondere, wenn es sich dabei um kommerzielle Produkte der 
kollektiven Handlungspraxis arbeitsteiliger Spezialistenteams handelt - 
kommt der Montage hingegen eine Schlüsselfunktion zu. 


2.3 Zur wechselseitigen Abhängigkeit von Montage und 
Fotogrammen 


Der vorige Abschnitt hat deutlich gemacht, welche prinzipiellen erkenntnis- 
theoretischen Nachteile sich aus der sozialwissenschaftlichen Vernachlässi- 
gung der Montage ergeben. Konkrete Probleme erwachsen daraus auch für 
die Forschungspraxis — etwa im Zusammenhang mit Film- oder Videomate- 
rial, das durch aufwändige Schnittfolgen und viele Einstellungen bestimmt 
ist. Oft lässt sich in solchen Fällen schwer entscheiden, aus welchen Sequen- 
zen und Einstellungen sich das Video zusammensetzt und welche Foto- 
gramme als für die Zusammensetzung repräsentativ ausgewählt werden sol- 
len. Auch wenn die Auswahl der Fotogramme gelingt, ist der Stellenwert der 
Interpretationsergebnisse insofern eingeschränkt, als diese nicht im Zusam- 


des Films liefert“. „[D]er eigentliche Erzeuger des Films“ ist laut Flusser „der Mann mit der 
Schere und dem Klebstoff“ (S. 92). 

15 Dies schließt nicht aus, dass auch in diesem Fall die Rekonstruktion der Montage das 
Erkenntnisinteresse von Forschungsprojekten darstellen kann. 
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menhang der Gesamtkomposition von Filmen oder Videos mit der Montage 
relationiert werden können. 

Bohnsack (2009) beschreibt ebenso am Beispiel von „Istanbul Total“, 
wie sich anhand des Einstellungswechsels und der Montage die hierarchische 
Ordnung des Videomaterials in Form von Haupt-, Unter- und eingelagerten 
Sequenzen rekonstruieren lässt. Nach den Prinzipien der „Repräsentanz“ und 
„Fokussierung“ (Bohnsack, 2009, S. 201) lassen sich aus den identifizierten 
Teilsequenzen Fotogramme für die Interpretation auswählen. Wie bereits 
erwähnt, stellt die Auswahl für die dokumentarische Methode an sich kein 
elementares Problem dar. Nach metatheoretischer Grundauffassung muss 
sich der Dokumentsinn — wenn auch in unterschiedlich starker Fokussierung 
— prinzipiell in allen Aspekten des Fallmaterials wiederspiegeln. Der Aus- 
wahlprozess von Fotogrammen auf dem Wege der Ableitung aus Sequenzen 
kann meiner Erfahrung nach jedoch bei komplexerem Videomaterial massiv 
erschwert oder sogar verunmöglicht werden. So zeichnen sich etwa Musikvi- 
deos oder Werbefilme durch eine so hohe Anzahl an Schnitten und Einstel- 
lungen aus, dass keine hierarchische Festlegung von Teilsequenzen, über 
welche die Fotogramme ausgewählt werden könnten, gelingt. In diesem Fall 
wäre es vorteilhaft, einen direkten empirischen Zugang zu den Montagemus- 
tern entwickeln zu können, aus dem sich dann wiederum — im Sinne der Va- 
lidierung einer rekonstruierten Fokussierungsmetapher — Suchstrategien für 
die Fotogramme generieren ließen. Wie zahlreiche Arbeiten zeigen (etwa: 
Baltruschat, 2010; Bohnsack, 2009; Sobotka, 2009), ist im Sinne einer wech- 
selseitigen Validierung auch der Vergleich von Fotogrammen mit der Ton- 
und Sprachebene von Filmen bzw. Videos möglich. Aus den hier dargelegten 
Gründen halte ich es jedoch für die dokumentarische Methode für unver- 
zichtbar, die Methodenentwicklung zur empirischen Rekonstruktion der 
Montage gezielt voranzutreiben. Dazu möchte ich in der Folge einige Vor- 
schläge machen. 


2.4 Zur empirischen Rekonstruktion der Montage 
2.4.1 Montagevariation und Gattungsanalyse 


Zur Entwicklung eines tieferen Verständnisses der Gesamtkomposition von 
Bildern schlägt Imdahl (1994) deren experimentelle Veränderung durch die 
Forscher/innen vor. Im Rahmen der Film- und Videointerpretation lässt sich 
das von Imdahl (1994) entwickelte und von Bohnsack (200la, S. 77) als 
„Kompositionsvariation“ bezeichnete Verfahren auch für die Interpretation 
von Fotogrammen, d.h. von Standbildern, anwenden. Die Übertragung des 
Konzepts auf die Interpretation der Montage ist anspruchsvoller, da sich 
Einstellungslängen, -wechsel und -reihenfolgen von Seiten der For- 
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scher/innen nicht so ohne weiteres modifizieren lassen.'° Es ist jedoch mög- 
lich, das Verfahren der Kompositionsvariation als Sonderform des theoreti- 
schen Samplings zur komparativen Analyse aufzufassen und so für die Inter- 
pretation der Montage nutzbar zu machen. Unter Kompositionsvariation der 
Montage bzw. Montagevariation (Kap. 5.2.1) kann zusammenfassend der 
Vergleich von Montagemustern verstanden werden, die sich in Videotran- 
skripten dokumentieren. Die aus der Montagevariation resultierenden Mög- 
lichkeiten einer gattungsimmanenten und gattungsübergreifenden Interpreta- 
tion der Montage stelle ich im Rahmen dieser Arbeit vor. Auf dem Wege der 
Montagevariation lassen sich im Sinne von Keppler (2006) sowohl Film- und 
Videomaterial zur komparativen Analyse auswählen als auch die Gattungs- 
zugehörigkeit eines bestimmten Fallmaterials empirisch bestimmen. Ab- 
schließend lässt sich aus der Rekonstruktion von Einstellungswechseln und 
Farbkontrasten ein ausgesprochen direkter Zugang zur empirischen Interpre- 
tation der Montage entwickeln. 


2.4.2 Farben und Farbkontraste 


Farben sind insofern für die Bild- und Videointerpretation von zentraler Be- 
deutung, als sie den Gegenstand, d. h. die (bewegten) Bilder, überhaupt erst 
in Erscheinung treten lassen.” Im Zusammenhang mit der Film- und Vi- 
deointerpretation eröffnet diese globale Eigenschaft von Farben auch einen 
empirischen Zugang zum formalen Verständnis von Fotogrammen und Mon- 
tage. Mit der Rekonstruktion von Farben ist die sozialwissenschaftliche For- 
schung aber auch vor ein empirisches Problem gestellt. Entgegen der All- 
tagsauffassung sind Farben — übrigens analog zur Kontextabhängigkeit von 
Texten — nämlich in bedeutsamer Weise von ihrer Umgebung abhängig und 
damit nicht ohne weiteres individuell bestimmbar. Johannes Itten (2000, 
2010) ist dieser Problematik bei der Gestaltung von Bildern begegnet. In 
Abkehr von einem isolierten Farbverständnis entwickelte er eine Farbtheorie, 
die explizit die Verhältnisse von Farben betont. Wie die empirischen Fallbei- 
spiele dieser Arbeit zeigen (Kap. 8 bis 10), lässt sich die Gestaltungstheorie 
der „sieben Farbkontraste“ (2000, 2010) als Rekonstruktionstheorie im Rah- 
men der dokumentarischen Methode nutzen. Für die empirische Forschung 
ist von Vorteil, dass Itten (2000, 2010) sich — im Gegensatz zu Imdahls 
(2003) kunsttheoretischen Reflexionen — sehr pragmatisch mit dem Verhält- 


16 Zur Verschiebung von Personen in Filmen bzw. Videos oder zur Modifikation der Montage 
sind fortgeschrittene Videoschnittkenntnisse erforderlich. 

17 Ittens (2000, 2010) Definition von Farben schließt auch die ,,Nichtfarben“ Schwarz und 
Weiß ein. Diese kleine aber wesentliche Präzisierung ist für die Untersuchung von 
Schwarz-Weiß-Filmen von Bedeutung. 
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nis zwischen physikalisch-chemischer Farbwirklichkeit und psychophysi- 
scher Farbwirkung befasst hat. Dabei sind mit Ittens Theorie der Farbkon- 
traste nicht nur zahlreiche analytische und kunsthistorische Fallbeispiele, 
sondern auch anschauliche Gestaltungsprinzipien verbunden, die für die 
sozialwissenschaftliche Forschungspraxis brauchbar sind. 

Zur Rekonstruktion der Montage ist es möglich, bei den farblichen Rela- 
tionen von Fotogrammen und Einstellungen anzusetzen, die sich in Video- 
transkripten als spezifische Montagemuster dokumentieren: Farbwechsel 
verstärken Schnitte und betonen den Einstellungswechsel, indem sie den 
visuellen Kontrast zwischen den verbundenen Einstellungen erhöhen.'* Wer- 
den Farben über Einstellungen hinweg beim Schnitt beibehalten, tritt dieser 
formal im Video bzw. Film stärker in den Hintergrund, wodurch eine stärkere 
Verbindung zwischen den Einstellungen entsteht (vgl. Kap. 3.4.2). Ein gerin- 
gerer Unterschied zwischen den Fotogrammen dokumentiert sich auch im 
Videotranskript. Dieses wirkt dadurch weniger mosaikartig und insgesamt 
homogener. In weiterer Folge spielen Farbkontraste im Zusammenhang mit 
der Montage auch für die Herstellung der Diegese (Souriau, 1997), d.h. des 
„Filmraums“, eine große Rolle. In professionellen Film- und Videoprodukti- 
onen werden durch die Verbindung farblich homologer Einstellungen Räu- 
me” und Atmosphären geschaffen bzw. durch die Verbindung farblich hete- 
rogener Einstellungen Ortswechsel (Kap. 9.6.1) angezeigt. Aus der empi- 
rischen Rekonstruktion der Verhältnisse von Einstellungs- und Farbwechseln 
sind im Rahmen der Montage somit auch Zugänge zur raumzeitlichen Ord- 
nung von Filmen und Videos zu erwarten. 

Auch die Bildinterpretation bzw. die Interpretation von Fotogrammen 
kann von einer Berücksichtigung der Farbenlehre Ittens (2000, 2010) profi- 
tieren. Da Farben und Farbkontraste darüber entscheiden, ob Linien und 
Formen im Bild in Erscheinung treten, ermöglicht die Interpretation der Far- 
ben und Farbkontraste auch die empirische Verständigung über die Konstitu- 
tion von Linien und Formen im Bild. Das wesentlichste Argument für die 
Anwendung des empirischen Instrumentariums der Farbkontraste auf die 
Bild- und Videointerpretation ist schließlich die daraus entstehende Möglich- 
keit zur bereits mehrfach angesprochenen wechselseitigen Validierung von 
Montage und Fotogrammen. In diesem Sinne hat dieses Kapitel hoffentlich 
deutlich gemacht, welche Optionen die Montage für die sozialwissenschaftli- 
che Film- und Videointerpretation bereithält. 


18 Diese Eigenschaft der Farben beim Schnitt wird auch von Computerprogrammen zur 
automatischen Schnitterkennung genutzt. 
19 Nicht umsonst gibt es im Deutschen den Begriff „Farbraum“. 
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Abbildung 5: Cinema Redux At Moma’s Action! Design Over Time, Muse- 
um of Modern Art, New York City, Künstler: Brendan Dawes (2004), 
http://brendandawes.com/blog/cinema-redux-at-momas-action-design-over- 
time 


Zur Einleitung des Kapitels Videotranskription bietet sich das Bild aus der 
Ausstellung „Action! Design Over Time“ von Brendan Dawes (2004) an 
(Abb. 5). Der Titel des Werks lautet „Cinema Redux“. Leitidee ist die Erzeu- 
gung der „visuellen Destillation eines gesamten Films“ (Dawes, 2004; eigene 
Übers.). Dazu zerlegt Dawes einen Film in sechzig Einzelbilder pro Minute, 
die er in mehren Reihen untereinander anordnet. In ihrem Ergebnis unter- 
scheidet sich diese Vorgehensweise nur unwesentlich vom methodischen 
Prozedere, das zur Erzeugung von Videotranskripten führt. Sowohl bei der 
künstlerischen als auch bei der wissenschaftlichen Auseinandersetzung geht 
es um die systematische und möglichst medienadäquate Transformation von 
bewegten Bildern in Einzelbildserien. 
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3 Videotranskription und das System MoViQ 


Die Transkription von Fallmaterial ist ein unterschätztes Themenfeld. Ge- 
meinhin wird es in Publikationen unter dem Begriff Datensicherung (etwa: 
Przyborski & Wohlrab-Sahr, 2009, S. 160) bzw. Dokumentation erhobener 
Daten (etwa: Bortz & Döring, 2002, S. 311) abgehandelt. Dabei kommt der 
Transkription gerade in der Forschungspraxis qualitativer Verfahren eine 
zentrale Bedeutung zu. Effektiv beansprucht die Erstellung von Transkripten 
im Rahmen qualitativer Forschungsprojekte einen großen Teil der Arbeits- 
zeit.” Im Rahmen von Forschungswerkstätten sind Transkripte von Fallmate- 
rial in der Regel die vorrangige Arbeits- und Kommunikationsgrundlage. 
Diese im Umgang mit Texttranskripten selbstverständliche Zugangsweise 
erscheint im Zusammenhang mit Videotranskripten nach wie vor erklärungs- 
bedürftig. Dieses Kapitel widmet sich deshalb den grundsätzlichen Fragen 
nach dem Nutzen von Videotranskripten für die Abbildung, das Sampling 
und die Interpretation von Fallmaterial. 


3.1 Zum Verhältnis von Videotranskription und 
Fallmaterial 


Dass Videotranskripte sich auf effektive Weise zur Abbildung von Video- 
bzw. Filmmaterial in Publikationen eignen, ist für Produktanalysen von 
Fernsehshows, Musikvideos und Amateurvideos bereits mehrfach demons- 
triert und betont worden (etwa: Baltruschat, 2010; Bohnsack, 2009; Hampl, 
2010; Przyborski & Wohlrab-Sahr, 2009; Sobotka, 2009). Im Rahmen ethno- 
grafisch-videografischer Forschung kommt der Videotranskription, den Er- 
fahrungen von Fritzsche und Wagner-Willi (2013) nach, ein geringerer Stel- 
lenwert zu. Dies ergibt sich zum einen aus der spezifischen Gestalt videogra- 
fischen Fallmaterials. Um in der Erhebungssituation möglichst viele Ereig- 
nisse simultan im Bild festzuhalten, wählen die Forscher/innen häufig die 
Totale als Kameraausschnitt.”' Durch den hohen resultierenden Detailreich- 
tum eignen sich damit videografische Aufnahmen später schlechter zur Ver- 


20 Abhängig von Ausgangsmedium (z. B.: Audio- oder Videoaufzeichnung) und Detaillie- 
rungsgrad (z. B.: bloßer Sprechtext oder Kennzeichnung von Tonhöhen) kann die Tran- 
skription sogar zeitlich aufwändiger als Erhebung und Auswertung zusammen sein. 

21 Eine Ausnahme davon stellen u.a. die kamera-ethnographischen Arbeiten von Mohn (z.B. 
2011) dar. Dabei sind wechselnde Kameraausschnitte und sogar Schnitte zwischen Ein- 
stellungen möglich. 
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kleinerung in Videotranskripten.”” Zum anderen sind Forscher/innen bei der 
Auswertung videographischer Erhebungen weniger auf Videotranskripte 
angewiesen, da sie oft auf umfangreiche zusätzliche Gegenstandsdaten (etwa 
in Form schriftlich vorliegender Beobachtungsprotokolle) zurückgreifen 
können. 

Unabhängig davon möchte ich in diesem Beitrag demonstrieren, wie sich 
Videotranskripte auch als Sampling- und Interpretationsinstrumente einsetzen 
lassen. Dazu bedarf es der methodologischen Bestimmung der gegenseitigen 
Referenz von Video bzw. Film und Transkript. Nach Bohnsacks (2009) Auf- 
fassung stellt die Erstellung von Transkripten an sich bereits „einen Teil der 
Analyse“ (Bohnsack, 2009, S. 171) dar, jedoch seien Videotranskripte noch 
nicht als Akte der Interpretation, sondern lediglich der medienimmanenten 
Übertragung anzusehen. Von Übertragung spricht Bohnsack, da durch das 
Transkript noch keine „begrifflich-theoretische Explikation“ (Mannheim, 
2003, S. 272) der Themen (im Sinne einer formulierenden Interpretation) 
sowie der Orientierungsstruktur (im Sinne einer reflektierenden Interpretati- 
on) vorgenommen wird. Durch ein geeignetes Videotranskriptionssystem — 
wie etwa MoViQ (Hampl, 2010; Przyborski & Wohlrab-Sahr, 2009), das ich 
in der Folge noch näher erläutern werde — wird sichergestellt, dass der 
Grundmodus des Ausgangsmediums durch die Transkription weitgehend 
beibehalten wird. Dabei ist wesentlich, dass „die visuelle Ebene durch Visu- 
elles und die verbale Ebene durch Textförmiges repräsentiert wird“ 
(Bohnsack, 2009, S. 171). Letztlich können Videotranskripte daher auch in 
Analogie zu Texttranskripten verstanden werden, die sich als Übertragungs- 
medien von Interviews und Gruppendiskussionen in der Forschungspraxis 
bewährt haben und in dieser Funktion allgemein akzeptiert werden. 

Zusammenfassend stellt die reine „Wiedergabe von Datenmaterialien“ in 
Form von Videotranskripten folglich keine Interpretation dar, solange sie 
„keine Explikation implizierter Bedeutungsgehalte vornimmt“ (Bohnsack, 
2009, S. 170). Innerhalb dieser klar umrissenen Grenzen ist somit die Ver- 
wendung von Videotranskripten gegenüber Film- bzw. Videomaterial als 
adäquates empirisches Kommunikations- und Entscheidungsinstrument für 
darauf aufbauende Sampling- und Interpretationsprozesse anzusehen. Damit 
ist keine schlichte Gleichsetzung von Fallmaterial und Transkript gemeint. 
Wie bereits an anderer Stelle erwähnt (Hampl, 2010), geht es vielmehr da- 
rum, die Erkenntnispotentiale möglichst optimal auszuschöpfen, in denen 
„Material und Transkript in jeweils (medien-)spezifischer Weise über die 
Simultan- und Sequenzstruktur von Videos“ (Hampl, 2010, S. 54) informie- 
ren. 


22 vgl. dazu auch Kap. 3.2.4c) „Bildgröße“. 
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3.2 Das Videotranskriptionssystem MoViQ 


Das Transkriptionssystem MoViQ (,Movies and Videos in Qualitative Social 
Research“) (Hampl, 2010; Przyborski & Wohlrab-Sahr, 2009) wurde mit der 
Motivation entwickelt, bewegte Bilder möglichst verlustfrei und forschungs- 
ökonomisch in Einzelbildserien sowie in dazu synchrone (Sprech-)Textzeilen 
umzusetzen. Zur Erhöhung der Lesbarkeit und zur schnelleren Erfassbarkeit 
von Videotranskripten wurde dabei besonderer Wert auf die formale Ähn- 
lichkeit zu bekannten visuellen Darstellungsformen wie Comicstrips, Foto- 
stories und Storyboards gelegt. Des Weiteren wurde bei der Konzeption - in 
Anlehnung an die aus der Musik bekannte Partiturschreibweise — auf die 
Einhaltung eines festen Bildtakts (Hampl, 2010, S. 56) bzw. Zeitrhythmus 
(Bohnsack, 2009, S. 171) geachtet. Deleuze (1996) sieht die festen Intervalle 
zwischen den Bildern” sowie die fixe Koppelung von Bild und Ton als 
grundlegende Medieneigenschaften von sowohl Film als auch Video an. Aus 
methodologischer und grundlagentheoretischer Sicht trägt MoViQ auch der 
Bedeutung von Fotogrammen für die Film- und Videoanalyse Rechnung 
(dazu: Baltruschat & Hampl, 2013; Bohnsack, 2009, Kapitel 5.5; siehe auch: 
Barthes, 1990, S. 64). Des Weiteren können Montageleistungen, deren Inter- 
pretation eine genaue Rekonstruktion der Relationen zwischen den Einzelbil- 
dern erforderlich macht, erst durch das bildliche Festhalten von Einzelbildse- 
rien systematisch analysiert werden (Bohnsack, 2009, S. 172; Hampl, 2010, 
S. 54). Das konstitutive Verhältnis zwischen visuellen und auditiven Film- 
anteilen lässt sich mittels Videotranskripten durch die synchrone Abbildung 
von Bild- und Tonspur bestimmen (Bohnsack, 2009, S. 171). Da die Erstel- 
lung von Videotranskripten ohne Softwareunterstützung mit hohem Zeit- und 
Arbeitsaufwand verbunden ist, habe ich im Rahmen meiner Dissertation — 
zur technischen Unterstützung des Transkriptionsprozesses nach dem System 
MoViQ - die Software MoviScript (Hampl, 2008) entwickelt.” MoviScript 
ist bisher in zahlreichen Publikationen zum Einsatz gekommen (etwa: 
Baltruschat, 2010; Bohnsack, 2009; Hampl, 2010; Sobotka, 2009). 


23 Ursprünglich wurde ein Bildtakt von 16, 18 oder 24 Bildern pro Sekunde durch die mecha- 
nischen Apparaturen der Aufnahme und Wiedergabe von Filmen gewährleistet. Aber auch 
im digitalen Zeitalter werden Filme mit fixen Bildraten von 24 bzw. 25 Bildern pro Sekun- 
de aufgenommen und projiziert. 

24 Für MoviScript habe ich ein Internetforum mit bisher ca. 300 Nutzer/innen aufgebaut, über 
welches die Software kostenlos abrufbar ist: www.moviscript.net. 
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3.2.1  Gütekriterien der Videotranskription 


Zur Beurteilung der Qualität von Videotranskriptionssystemen haben Przy- 
borski und Wohlrab-Sahr (2009, S. 164) insgesamt fünf Gütekriterien formu- 
liert. Diese möchte ich in der Folge anhand meiner eigenen Erfahrungen mit 
dem Videotranskriptionssystem MoViQ erläutern. 


a) Praktikabilitat 


Ein Transkriptionssystem ist dann praktikabel, wenn es sich in der For- 
schungspraxis leicht einsetzen lässt. Was nützt das eleganteste Transkripti- 
onssystem, wenn seine Anwendbarkeit an technischen Hürden scheitert? Die 
Erstellung von Videotranskripten ist weit aufwändiger als jene von Texttran- 
skripten. Damit stellt das Gütekriterium der Praktikabilität die Videotran- 
skription prinzipiell vor hohe Herausforderungen. Denn der Herstellungspro- 
zess von Videotranskripten besteht aus einer nicht unbeträchtlichen Zahl an 
Arbeitsschritten, die zum Teil fortgeschrittene Computer- und Videoschnitt- 
kenntnisse erfordern. Auch die Softwareanforderungen sind hoch: Während 
für die Anfertigung von Texttranskripten ein einfaches Textverarbeitungs- 
programm ausreicht, benötigt man für Videotranskripte einen beachtlichen 
Fächer an Software zur Lösung unterschiedlicher Teilaufgaben. Im komple- 
xen Zusammenspiel der Komponenten können auch zahlreiche Inkompatibi- 
litäten auftreten, die von den Anwender/inne/n erst gelöst werden müssen, 
um am Ende ein erstes Rohtranskript zu erhalten. Aus diesem Grunde habe 
ich mich im Zuge meiner Forschungsarbeit der Programmierung der er- 
wähnten Videotranskriptionssoftware MoviScript gewidmet. Zwar lassen 
sich MoViQ-Transkripte auch manuell erstellen, forschungspraktisch wirk- 
lich praktikabel ist die Anwendung des Transkriptionssystems jedoch nur, 
wenn sich die Umwandlung der Videodaten in Videotranskripte zumindest 
teilweise automatisieren lässt. 


b) Ausbaufähigkeit und Flexibilität 


Ein Transkriptionssystem ist ausbaufähig und flexibel gegenüber dem Da- 
tenmaterial, wenn es prinzipiell erlaubt, sämtliche visuelle und auditive Er- 
eignisse zu notieren. Solange es um die Erfassung von Gesprächsdaten geht, 
können Videotranskripte nach dem System MoViQ diesem Anspruch in 
umfassender Weise und in derselben Form wie Texttranskripte gerecht wer- 
den. Hinsichtlich der Wiedergabe von Ereignissen in der Bilddimension un- 
terliegen Videotranskripte jedoch grundsätzlichen Beschränkungen. So lassen 
sich aus Platzgründen beispielsweise nicht alle 25 Teilbilder, die ein Video 
pro Sekunde enthält, im Transkript auch abbilden. Es ist jedoch als wesentli- 
che Stärke des Transkriptionssystems MoViQ anzusehen, dass diese Mög- 
lichkeit prinzipiell besteht. Während Texttranskripte im Wesentlichen ein 
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relativ ähnliches Aussehen haben, muss man sich vermutlich hinsichtlich der 
Arbeit mit Videotranskripten an eine größere Bandbreite an Darstellungs- 
formen gewöhnen. Dies hat zum einen mit der Flexibilität der Partitur- 
schreibweise zu tun, die je nach Erkenntnisinteresse und Material das Hinzu- 
fügen beliebig vieler Spuren ermöglicht. Zum anderen kann das Fallmaterial 
jedoch auch erkenntnisgeleitet in variablem Detaillierungsgrad dargestellt 
werden. 


c) Erlernbarkeit 


Ein Transkriptionssystem ist leicht erlernbar, wenn es ohne lange Einarbei- 
tungszeit und Lektüre von Forscher/inne/n angewendet werden kann. Diese 
Bedingung erfüllt das Videotranskriptionssystem MoViQ prinzipiell durch 
seine schlichte Art der Darstellung, die an die Abbildungslogik von Fotosto- 
ries, Comicstrips und Storyboards anschließt. 

Eine wesentliche Hürde in puncto Erlernbarkeit stellen die technischen 
Voraussetzungen dar, die zur Erstellung von Videotranskripten erforderlich 
sind. Der Umgang mit Computerprogrammen und digitaler Videoverarbei- 
tung ist nicht voraussetzungsfrei. Im Wesentlichen berührt dieser Punkt je- 
doch dieselben Aspekte, die bereits im Zusammenhang mit dem Gütekrite- 
rium der Praktikabilität genannt wurden. 


d) Lesbarkeit 


Ein Transkriptionssystem ist gut „lesbar“, wenn sich die damit erstellten 
Transkripte rasch und reibungslos erfassen lassen. Dieses Gütekriterium ist 
beispielsweise hinsichtlich der intersubjektiven Kommunikation im Rahmen 
von Forschungswerkstätten relevant. Wenn ein/e Teilnehmer/in ein Video- 
transkript zur Besprechung von Fallmaterial vorbereitet, so ist es wesentlich, 
dass alle anderen Beteiligten diesem auch folgen können. Wie die Erfahrung 
zeigt, sind Videotranskripte, die nach dem System MoViQ erstellt wurden, 
intuitiv gut erfassbar und leicht lesbar.” Dies hat nicht zuletzt mit der zuvor 
erwähnten Abbildungslogik zu tun, die an kulturbedingte Seh- und Lesege- 
wohnheiten (media literacy) anschließt. 


25 Voraussetzung dafür ist, dass die Abbildungsgröße der Fotogrammserien dem Fallmaterial 
angepasst ist (vgl. Kap. 3.2.1c) und 3.2.4c)). Im Falle von Produktanalysen (se- 
mi-)professioneller Videos und Filme eignen sich Videotranskripte mit ca. fünf Bildern pro 
Zeile. Fallmaterial aus dem Anwendungsbereich der Videographie (bspw. der Unter- 
richtsforschung), in dem oftmals viele in Interaktion befindliche Menschen relativ klein im 
Bild zu sehen sind, erfordern eine Vergrößerung der Einzelbilder, was nur durch eine ent- 
sprechende Reduktion der maximalen Bildanzahl pro Zeile erreicht werden kann. Dies kann 
bis zum Verzicht auf ein Videotranskript hin zur reinen Einzelbild- bzw. Fotogrammdar- 
stellung führen; zum Verhältnis von Fotogramm und Videotranskript siehe Baltruschat und 
Hampl (2013). 
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e) Die eindeutige Zuordenbarkeit von akustischen und visuellen Ereignissen 


Ein Transkriptionssystem gewährleistet die eindeutige Zuordnung von akus- 
tischen und visuellen Ereignissen, wenn es deren synchrone Darstellung im 
Transkript erlaubt. Das Videotranskriptionssystem MoViQ erfüllt dieses 
Kriterium prinzipiell durch konsequente Orientierung an der Partiturschreib- 
weise. Ähnlich wie beim Gütekriterium der Ausbaufähigkeit und Flexibilität 
besteht jedoch nicht die Möglichkeit, diese eindeutige Zuordnung im Video- 
transkript generell herzustellen. Vielmehr hängt der Detaillierungsgrad der 
Zuordnung von der Wahl des jeweiligen Betrachtungsausschnitts ab, der 
seinerseits vom Erkenntnisinteresse abhängt. Üblicherweise ist im Rahmen 
der Video- und Filminterpretation nach der dokumentarischen Methode (wie 
auch das in diesem Beitrag behandelte Fallbeispiel zeigt) eine direkte Bild- 
Text-Zuordnung von einer Sekunde ausreichend. Für die Betrachtung kürze- 
rer Intervalle ist es erforderlich, die Anzahl der Bilder pro Sekunde zu erhö- 
hen. Dadurch vergrößert sich zum einen aber zugleich auch der Platzbedarf 
des betreffenden Videotranskripts. Zum anderen kann eine zu feine Unter- 
teilung die Lesbarkeit des Transkripts verringern. 

Zusammenfassend lässt sich an dieser Stelle festhalten, dass das Video- 
transkriptionssystem MoViQ grundsätzlich den genannten fünf Gütekriterien 
für Transkriptionssysteme entspricht. Abstriche sind beim derzeitigen Stand 
der Technik insbesondere hinsichtlich seiner Praktikabilität zu machen. Dies- 
bezüglich kann die Entwicklung von Videotranskriptionssoftware, wie bei- 
spielsweise MoviScript, einen Beitrag zur Überwindung technischer Hürden 
leisten. Hinsichtlich Ausbaufähigkeit, Flexibilität und Zuordenbarkeit von 
akustischen und visuellen Ereignissen stellt uns die Videotranskription vor 
ein klassisches Optimierungsproblem: Verbesserungen in einer Dimension 
führen zu Verschlechterungen in einer anderen. Diese Problematik lässt sich 
nur dadurch bewältigen, dass Videotranskripte in noch viel stärkerem Maße 
als Texttranskripte an die Erfordernisse des Fallmaterials und des Erkennt- 
nisinteresses angepasst werden. Die besonderen Potentiale des Videotran- 
skriptionssystems MoViQ sind diesbezüglich seine hohe Flexibilität sowie 
seine leichte Erlernbarkeit und Lesbarkeit. 


3.2.2 Herausforderungen und Potentiale der Videotranskription 


Nachdem ich im vorhergehenden Abschnitt auf die technischen Hürden der 
Videotranskription eingegangen bin, möchte ich mich nunmehr ihren Poten- 
tialen für die Videointerpretation widmen. Zum einen erhöht der Einsatz von 
Transkripten in bedeutsamem Maße die Nachvollziehbarkeit der Interpretati- 
onen. In ähnlicher Weise wie bei der Verwendung von Texttranskripten im 
Rahmen der Interpretation von Interviews und Gruppendiskussionen erleich- 
tern Videotranskripte die Orientierung im Fallmaterial sowie die intersubjek- 
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tive Verständigung über das Fallmaterial im Kontext von Forschungswerk- 
stätten. Die Interpretation in der Bilddimension ist methodisch weit an- 
spruchsvoller als in der Textdimension. Indem Videotranskripte das bewegte 
Bild im Modus von Bildserien darzustellen vermögen, können sie als unver- 
zichtbarer Referenzrahmen für die darauf aufbauende Interpretation dieser 
Formalstruktur angesehen werden. 

Zum anderen ist der Einsatz von Videotranskripten insbesondere hin- 
sichtlich der Rekonstruktion der Montage ein wichtiges Instrument der Me- 
thodenentwicklung. Im Vergleich zu Texten und Bildern sind Filme und 
Videos in hohem Maße durch die Verhältnisse zwischen verschiedenen Me- 
dienaspekten charakterisiert. In der Montage dokumentiert sich etwa das 
Verhältnis zwischen Bild und Ton. Jedoch ist gerade die Montage ohne Vi- 
deotranskripte systematisch nur schwer erfassbar und rekonstruierbar. Zwar 
lassen sich Videos oder Filme zu jedem beliebigen Zeitpunkt anhalten oder 
zur nochmaligen Vorführung zurückspulen. Es ist jedoch nicht möglich, 
zugleich Bild und Ton in ihrem Verhältnis zueinander festzuhalten. Wird das 
Video angehalten, so bleibt es stumm; läuft es ab, so verändert es sich stän- 
dig. Die einzige Lösung dieser paradoxen Konstellation ist es, Bild- und 
Tondimension voneinander zu trennen und separat auf jeweils medienspezifi- 
sche Weise zu transformieren. Dabei wird das Videobild in die geordnete 
Reihe seiner Standbilder zerlegt, während die gesprochene Sprache in ge- 
druckten Text umgewandelt wird.” Erst durch die (Wieder-) Zusammenfü- 
gung der transformierten Bild- und der Textdimension im Videotranskript 
lassen sich — in eindeutiger Referentialität zum Fallmaterial — sowohl die 
Bewegungen im Bild wie auch in der Sprache simultan darstellen.” 


26 Die erwähnte Zerlegung in Einzelbildserien wird auch von aktuellen Videoschnittprogram- 
men (etwa: Apple iMovie, Adobe Premiere etc.) genutzt; die Spracherkennung nicht. 

27 Die detaillierte Beschreibung dieses Transformationsprozesses soll zugleich darauf auf- 
merksam machen, dass Videotranskripte nicht nur Forschungsinstrumente sondern auch Ar- 
tefakte des Handelns der Forscher/innen sind. In der abschließenden Diskussion dieser Ar- 
beit (Kap. 10 weise ich mithilfe von Latour (2002) ausführlicher auf die erforderliche Re- 
flexion dieser Problematik hin. Die durch Standardisierung von Transkripten (auch 
Texttranskripten!) angestrebte Erhöhung der Vergleichbarkeit des Fallmaterials geht un- 
vermeidlich immer auch mit dessen Dekontexualisierung — zugunsten einer impliziten wis- 
senschaftlichen Ästhetik der Forscher/innen — einher. 
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3.2.3 Fallbeispiel 


Abbildung 6: Videotranskript der Eingangspassage (Ausschnitt) der TV-Sen- 
dung „Istanbul Total“ (2004) 


Projekt „Das Verhältnis von Türkischem und Deutschem im Fernsehen“ 


Passage (oder Sequenz): | Ausschnitt Eingangspassage 


Film (oder Video): Istanbul Total — Unser Außenstudio 

Dateiname oder URL: http://tvtotal.prosieben.de/tvtotal/videos/player/?contentld=14144 
Datum der Aufnahme: 10.05.2004 

Time Code: 1:35-2:24 min. 

Dauer: 0:50 min. 

Transkription: Stefan Hampl 


Korrektur: Stefan Hampl 


Am: _|Christof Daum ist vorzeitig Meister geworden hier in der Türkei Fenerbahçe liegt übrigens drüben auf der asia- 
Musik: 
Geräusch: 
Sequenz: 


TC: 100 sec. 101 sec. 102 sec. 103 sec. 104 sec. 


Am: tischen Seite ahh da sind diese Anhöhen zu sehen da hinter dem ersten Hügel 
Musik: 
Geräusch: 
Sequenz: 


TC: 105 sec. 106 sec. 107 sec. 108 sec. 109 sec. 


Am: list das Fenerbahge-Stadion und ahh da war natürlich gestern was los hier in der Stadt das können Sie sich gar nicht 
Musik: 
Geräusch: 
Sequenz: Eingelagerte Sequenz (ES) 
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TC: 


110 sec. 


111 sec. 


112 sec. 


113 sec. 


114 sec. 


118 sec. 


Am: [vorstellen überall GU üüü es wurde gehupt und gefeiert ich dachte im ersten Moment ich bin doch schon seit 
Musik: 
Geräusch: 
Sequenz: 

TC: 115 sec. 116 sec. 117 sec. 


119 sec. 


Am: lein paar Tagen da warum erst heute die Freude ja? aber es handelte sich äh 
Musik: 
Geräusch: 
Sequenz: 

TC: 120 sec. 121 sec. 122 sec. 


123 sec. 


124 sec. 


Am: um die Fans von Fenerbahçe die dort gefeiert haben und äh hier ist einiges los ich weiß nicht 
Musik: 
Geräusch: 
Sequenz: 

TC: 125 sec. 126 sec. 


127 sec. 


129 sec. 


128 sec. 


Am: wer schon mal in Istanbul war von Ihnen ich kann Ihnen nur empfehlen fahren Sie hier hin wenn sie hier kriegen sie einfach alles 
Musik: 
Geräusch: 
Sequenz: 

TC: 130 sec. 131 sec. 132 sec. 


133 sec. 


Am: 


: überall Handler auf der Straße die die Jacke aufmachen und so sagen [sag mal brauchst du 12 Punkte für Max ja? 
Musik: 


134 sec. 


th) 
© 


Geräusch: 


Sequenz: 


[Am spricht mit türkischem Akzent] 
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TC: 135 sec. 136 sec. 137 sec. 138 sec. 139 sec. 


isch habe dabei hier] un ähh fantastisch wir ham ne Schifffahrt gemacht entlang des 


Am: 
Musik: 
Geräusch: [Am spricht mit türkischem Akzent] 
Sequenz: 
141 sec. 


TC: 140 sec. 142 sec. 143 sec. 144 sec. 


Am: 
Musik: 
Geräusch: 


Untersequenz (US) 


3.2.4 Aufbau des Videotranskripts 


Wie der Blick auf das exemplarische Videotranskript (Abbildung 6) verdeut- 
licht, werden darin kaum Aussagen über die technische Herstellung des zu- 
grundeliegenden Fallmaterials gemacht (bspw. zur Kameraeinstellung). Das 
hat damit zu tun, dass diese Angaben letztlich für die sozialwissenschaftliche 
Interpretation im Rahmen der dokumentarischen Methode nicht ausschlagge- 
bend sind. Laut Bohnsack (2009, S. 198) interessierten weniger die techni- 
schen Mittel, die zur Herstellung eines Films oder Videos als (Kultur-) Pro- 
dukt beigetragen haben (sofern sie am Produkt selbst überhaupt rekonstruier- 
bar sind). Von vorrangigem Interesse sind vielmehr das „gestaltete Produkt 
und der sich in ihm dokumentierende Habitus“ (Bohnsack, 2009, S. 198). 


a) Transkriptkopf 


Zu Beginn des Videotranskripts werden nach Przyborski und Wohlrab-Sahr 
(2009, S. 165) im sogenannten „Transkript“- oder „Transkriptionskopf“ 
grundlegende Angaben zu Herkunft und Einordnung der Transkription ge- 
macht. Der Kopf eines Videotranskripts sollte im Wesentlichen folgende 
Informationen enthalten: 


1. Projektbezeichnung 

2. Name oder Kennzahl der Passage bzw. Sequenz 

3. Name bzw. Bezeichnung des Falles/Dateiname oder URL des Fall- 
materials 
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Datum der Aufnahme 

Time Code, der angibt, wo sich die Stelle im Videomaterial befindet 
Dauer der Passage 

Name des Transkribenten/der Transkribentin 

Name des Korrekturlesers/der Korrekturleserin 


IM 


Das Transkript stammt aus der Sendung „Istanbul Total“. Die Projektbe- 
zeichnung könnte lauten: „das Verhältnis von Türkischem und Deutschem im 
Fernsehen“. Die vorliegende Transkriptpassage bzw. -sequenz habe ich als 
„Ausschnitt der Eingangspassage“ bezeichnet, da es sich bei ihr um einen 
Teil der längeren Eingangspassage des untersuchten Videos handelt. Das 
Video trägt den Namen „Istanbul Total — Unser Außenstudio“. Diese Be- 
zeichnung geht auf den Fernsehsender ProSieben als Kollektiv abbildender 
Bildproduzent/inn/en zurück. Zur genaueren Identifizierung des Fallmaterials 
kann entweder der Name oder die Bezeichnung des Falles angegeben werden. 
Eine alternative Möglichkeit stellt die Angabe des Dateinamens bzw. der 
Internetadresse (URL) des Videos dar. Bei Videos, die als Medien der Mas- 
senkommunikation fungieren, erleichtert die Angabe der URL das spätere 
Auffinden des Fallmaterials. Der Punkt „Datum der Aufnahme“ enthält die 
Information über den Entstehungszeitpunkt des Films oder Videos. Im Feld 
„Time Code“ sind die konkreten Zeitmarkierungen angegeben, zwischen 
denen das Fallmaterial der Passage bzw. Sequenz transkribiert wurde. Da- 
runter ist die resultierende „Dauer“ der transkribierten Passage bzw. Sequenz 
angegeben. Im vorliegenden Fall wurden zwischen den Time Codes 95 und 
144 Sekunden insgesamt 50 Sekunden transkribiert. Als Ersteller des Video- 
transkripts habe ich im Feld „Transkription“ meinen Namen eingetragen. Die 
Korrektur wurde ebenfalls von mir vorgenommen. 


b) MoViQ-Partitur 


Im Anschluss an den Transkriptkopf folgt das eigentliche Videotranskript, 
das im Sinne des Gütekriteriums der „Ausbaufähigkeit“ (Przyborski & Wohl- 
rab-Sahr, 2009, S. 164) wie eine Musikpartitur gestaltet ist. Prinzipiell kann 
diese Partitur aus einer oder mehreren Bildspuren sowie aus einer oder meh- 
reren Ton-, Text- oder Kodierungsspuren bestehen. Das vorliegende Video- 
transkript besteht aus einer Bildspur und drei Tonspuren. In diesem Zusam- 
menhang lässt sich am konkreten Fallmaterial gleich ein erstes formales Be- 
stimmungsmerkmal des Mediums Video festmachen: Das Bild ist nie leer. In 
der Bilddimension ist immer etwas zu sehen”, während die Ausprägungen 
auf der Tonebene (Sprache, Musik, Geräusche) zeitweise auch fehlen kön- 


28 Dies ist ex negativo selbst dann der Fall, wenn das Bild schwarz ist. 
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nen. Im betrachteten Videotranskript kommen beispielsweise keine Musik 
und nur wenige Geräusche vor. Der Sprecher (Am) hingegen ist fast ständig 
am Wort, was am transkribierten Sprechtext deutlich wird. In zusätzlichen 
Kodierungsspuren können seitens der Interpret/inn/en bestimmte Transkript- 
abschnitte gekennzeichnet werden. Im vorliegenden Fall wurde im Video- 
transkript die Zeile „Sequenz“ hinzugefügt, um hervorzuheben, wie sich das 
Fallmaterial in Haupt-, Unter- und eingelagerte Sequenzen” gliedert. Abhän- 
gig vom Erkenntnisinteresse ist im Sinne der Ausbaufähigkeit des Transkrip- 
tionssystems auch das Hinzufügen von weiteren Spuren möglich.” 

Neben dem Gütekriterium der Ausbaufähigkeit spricht noch ein weiteres 
Kriterium für die Partiturschreibweise nach dem System MoViQ: Die resul- 
tierende Abbildungslogik ermöglicht nämlich auch eine eindeutige Zuord- 
nung von visuellen und akustischen Ereignissen (Przyborski & Wohlrab- 
Sahr, 2009, S. 169), was als Grundvoraussetzung für die Interpretation des 
Verhältnisses von Bild und (Sprech-)Text bzw. Ton anzusehen ist. Des Wei- 
teren stellt die feste Koppelung zwischen Bild- und Tonebene im Videotran- 
skript — in Kombination mit der Einhaltung eines festen Bildtakts — die we- 
sentliche formale Grundlage für die fallinterne und fallübergreifende kompa- 
rative Analyse dar. Indem die Zeitintervalle zwischen den Bildern und den 
Tonereignissen konstant gehalten werden, treten Gemeinsamkeiten und Un- 
terschiede etwa auf der Ebene der Montage deutlicher hervor. Im vorliegen- 
den Videotranskript (Abbildung 6) ermöglicht der konstante Bildtakt von 
einem Bild pro Sekunde u. a. die Feststellung, dass der Moderator — gegen- 
über anderen Sequenzen — die meiste Zeit hindurch im Bild zu sehen ist. 
Damit ist im Videotranskript auf einen Blick erkennbar, wie der Moderator 
durch seine bloße Präsenz im Video Einfluss erlangt.*' Die Einstellung von 
einem Bild pro Sekunde orientiert sich am Gütekriterium der „Lesbarkeit“ 
(Przyborski & Wohlrab-Sahr, 2009, S. 164) und hat sich für die ausgewogene 
Abbildung von Videos und Filmen bewährt. Welche genaue Zeiteinteilung 
für ein Videotranskript sinnvoll ist, hängt aber letztlich vom Erkenntnisinte- 
resse ab. Stehen bspw. die Leistungen der abgebildeten Bildproduzent/inn/en 
stärker im Fokus bzw. interessieren die Herstellungsbedingungen spezifischer 
körperlicher Gesten bzw. Gebärden, so sollten kleinere Zeitintervalle gewählt 
werden. Bereits bei einem Bildtakt von einer halben Sekunde werden Kör- 
perbewegungen weit detailreicher aufgelöst und sind damit besser beobacht- 
bar. Der einzige Nachteil dabei ist, dass feiner aufgelöste”” Videotranskripte 


29 Die detaillierte Differenzierung dieser drei Sequenzarten erfolgt im Kapitel 3.3. 

30 Baltruschat (2010, S. 30) kennzeichnet bspw. durch Pfeile im Transkript die Richtung der 
Kamerabewegung. 

31 Durch Feininterpretation ausgewählter Fotogramme, der Montage sowie des Sprechtextes 
lässt sich dieser Befund validieren (vgl. Bohnsack, 2009; Hampl, 2010). 

32 Das meint Videotranskripte mit einem Bildtakt von mehr als einem Bild pro Sekunde. 
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mehr Platz in Publikationen beanspruchen und der Text teilweise gesperrt 
bzw. zerdehnt gedruckt werden muss, damit er weiterhin synchron zum Bild 
ist. 


c) Bildgröße 


MoViQ-Videotranskripte bestehen üblicherweise aus ca. fünf Bildern pro 
Zeile. Dieser Wert hat sich für Videomaterial im Format 4:3 als zweckmäßig 
erwiesen, um ein Maximum an Fotogrammen abbilden und zugleich den 
Inhalt der Fotogramme noch erkennen zu können. Abhängig von der Be- 
schaffenheit des Fallmaterials kann es jedoch erforderlich sein, die Bildan- 
zahl und -größe zu modifizieren. So kann es etwa für Spielfilmmaterial, des- 
sen Bildformat meist breiter ist, zweckmäßig sein, die Bilder pro Zeile auf 
drei bis vier zu reduzieren. Dies kann auch bei Videos, die zu Forschungs- 
zwecken erstellt wurden, erforderlich sein, um die Leistungen der abgebilde- 
ten Bildproduzent/inn/en (z.B. Gebärden und gestische bzw. mimische Inter- 
aktionen) in ihrem Ablauf besser beobachten zu können (Abbildung 10). 
Zumindest drei Bilder pro Bildzeile sind aus Abbildungsgründen jedoch zu 
empfehlen, da ansonsten die Sequenzhaftigkeit des Videos durch die Abbil- 
dung verloren geht. 


3.3 Videotranskripte als Grundlage des Samplings 
3.3.1 Sequenzen 


Im Falle von Videoproduktionen, die im Wesentlichen durch einen Hand- 
lungsstrang bestimmt sind und daher mit nur geringen Schnittleistungen 
auskommen — etwa Fernsehshows (Bohnsack, 2009; Hampl, 2010; Sobotka, 
2009) und Amateurvideos (Baltruschat, 2010) — lässt sich mithilfe von Vi- 
deotranskripten auf einfachem Wege die Sequenzstruktur des Fallmaterials 
bestimmen. Nach der Einteilung von Bohnsack (Bohnsack, 2009, S. 196) 
kann prinzipiell zwischen „Hauptsequenzen (HS)“, „Untersequenzen (US)“ 
und „eingelagerten Sequenzen (ES)“ unterschieden werden. Als Hauptse- 
quenzen lassen sich jene Teile eines Videos oder Films verstehen, die über 
etwaige Schnitte bzw. Einstellungswechsel hinweg auf immanenter Sinn- 
ebene” als zusammengehörend identifizierbar sind. Im vorliegenden Fallbei- 
spiel dokumentiert sich im gesamten Ausschnitt der Eingangspassage (95- 
144 sec.) eine einzige Hauptsequenz: Der Moderator Stefan Raab auf dem 
Balkon. 


33 Im Falle von Bildern und Videos umfasst dies die vorikonografische und ikonografische 
Bildebene. 
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Als Untersequenzen bezeichnet Bohnsack (2009, S. 196) solche Sequenzen, 
die als „spezifische Modifikationen der Hauptsequenz identifiziert werden 
können“. Meist handelt es sich dabei um Variationen der Kameraposition 
oder des Bildausschnitts, wobei die Identität der abgebildeten Bildprodu- 
zent/inn/en bestehen bleibt. Im vorliegenden Fallbeispiel lässt sich im Tran- 
skriptabschnitt 140-143 sec. eine Untersequenz erkennen: Der Moderator 
Stefan Raab in Totale seitlich am Balkon aufgenommen. 

Als eingelagerte Sequenzen versteht Bohnsack (2009, S. 196) solche, die 
„fremde Szenerien“ zeigen, „nach denen [...] wieder zur Hauptsequenz zu- 
rückgekehrt wird“. Im vorliegenden Fallbeispiel dokumentiert sich im Tran- 
skriptabschnitt 105-108 sec. eine eingelagerte Sequenz: Das Fenerbahçe- 
Stadion auf der asiatischen Seite des Bosporus. 

Zusammenfassend zeigt sich bereits in dieser einfachen, im Videotran- 
skript direkt erkennbaren, Sequenzierung der hierarchische Grundaufbau des 
Fallmaterials.** Der Moderator der Fernsehsendung dominiert das Geschehen 
in einer einzigen Hauptsequenz (HS 95-144). Die Untersequenz (US 140- 
143) zeigt ihn noch einmal, nur aus anderer Perspektive. Nur in einer einzi- 
gen Sequenz (ES 105-108) ist der Moderator nicht zu sehen. Bei ihr handelt 
es sich allerdings um eine eingelagerte Sequenz, auf die unvermeidbar wieder 
die Hauptsequenz folgt.” 


3.3.2 Einstellungen und Fotogramme 


Bohnsack (2009, S. 201) empfiehlt zur detaillierteren Interpretation der Ein- 
stellungen die Auswahl repräsentativer Fotogramme. Ausgewählt werden 
sollen dabei jene Fotogramme, welche „die umfangreichste Hauptsequenz in 
ihrer häufigsten Einstellungsvariante (HS IA) und in ihrer zweithäufigsten 
Einstellungsvariante (HS IB) [...] zu repräsentieren vermögen“ (Bohnsack, 
2009, S. 201). Die Auswahl kann mithilfe von Videotranskripten geleistet 
werden. Im vorliegenden Fall wäre als häufigste Einstellungsvariante der 
Moderator in Frontalaufnahme anzusehen, als zweithäufigste der Moderator 
seitlich am Balkon (US 140-143). 


34 Detailliertere Rekonstruktionen des Fallmaterials finden sich in Bohnsack (2009) und 
Hampl (2010). 

35 Der Schnitt fällt bei der Betrachtung des Videos durch den mangelnden Farbkontrast des 
Einstellungswechsels kaum auf. Dieses Phänomen wird anhand der Musikvideos „Araba“ 
(Kap. 8 und 0) noch genauer erläutert. 
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Abbildung 7: v.l.n.r. Fotogramme 112 und 140 


Wie an dieser Stelle deutlich wird, ist mit der Auswahl bestimmter Foto- 
gramme zugleich eine bestimmte Richtung der Interpretation vorweggenom- 
men. Im folgenden Abschnitt möchte ich nun auf weitere Möglichkeiten 
eingehen, wie auf der Basis von Videotranskripten das Fallmaterial interpre- 
tiert werden kann. 


3.4 Videotranskripte als Grundlage der Interpretation 
3.4.1 Fokussierte Gesten bzw. Gebärden 


Mithilfe des Videotranskripts lassen sich im Video zwei interessante Gesten 
bzw. Gebärden” ausmachen, die als Fokussierungen im Sinne dramaturgi- 
scher Verdichtungen bzw. Brüche (Bohnsack, 2009) anzusehen sind. Die 
erste Geste kann auf ikonografischer Ebene als Zeigen mit der Hand identifi- 
ziert werden. Sie ist durch das Heben und Strecken der Hand relativ rasch 
und einfach herzustellen. Im Videotranskript ist diese Geste zirka sieben 
Sekunden lang zu sehen (Fotogramme 98-104). Da sich die einzelnen Foto- 
gramme dieser Bildfolge kaum unterscheiden, reicht zur detaillierteren Inter- 
pretation dieser Geste im Wesentlichen die Auswahl eines einzelnen Foto- 


36 Um der inhaltlichen Differenzierung zwischen vorikonografischer und ikonografischer 
Interpretation hinsichtlich der Beschreibung der Leistungen der abgebildeten Bildprodu- 
zent/inn/en Rechnung zu tragen, werden in dieser Arbeit die — im Alltag oft synonym ge- 
brauchten — Begriffe „Gebärde“ und „Geste“ analytisch unterschieden. Als Gebärden wer- 
den Körperhaltungen oder -bewegungen auf vorikonografischer Ebene aufgefasst. Als Ges- 
ten sind bereits mit Common-Sense aufgeladene Gebärden auf ikonografischer Ebene zu 
verstehen. In diesem Verhältnis können Gesten (funktional) aus einer oder mehreren Ge- 
bärden bestehen. Im Gegensatz zum Deutschen gibt es im Englischen und Französischen 
(wie auch in vielen anderen Sprachen) für beide Begriffe übrigens nur ein Wort: „geste“. 
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gramms (Abbildung 8). Dieses kann nun in weiterer Folge einer klassischen 
Bildinterpretation zugeführt werden. 


Abbildung 8: Fotogramm 100 


Die zweite Geste lässt sich auf ikonografischer Ebene als „Jacke aufmachen 
und mit dem Finger zeigen“ identifizieren. Prinzipiell nimmt sie im Video in 
etwa denselben zeitlichen Raum ein, nämlich zirka sechs Sekunden (Foto- 
gramme 131-136), nur ist sie hinsichtlich ihres formalen Aufbaus komplexer 
als die erste. Bei genauerer Betrachtung lässt sich die zweite auffällige Geste 
des Videos nämlich nur durch die Einhaltung einer zeitlichen Ordnung von 
Teilgesten bzw. Gebärden herstellen (zuerst den Mantel öffnen, dann auf die 
Innenseite des Mantels zeigen). Zur detaillierten Rekonstruktion des perfor- 
mativen Ablaufs der Geste reicht die Auswahl eines einzelnen Fotogramms 
daher nicht aus. Es bedarf einer sequenziellen Abfolge mehrerer Bilder, um 
die Herstellung der Geste nachzuvollziehen (vgl. Abbildung 9, aber auch 
Abbildung 2). Aus dem Videotranskript kann dieser fokussierte Sequenzaus- 
schnitt zur Interpretation ausgewählt werden, um im Vergleich der minimalen 
Variationen von Bild zu Bild ein tieferes Verständnis der Herstellungsbedin- 
gungen der Geste (bzw. der damit in Zusammenhang stehenden Gebärden) zu 
gewinnen. 
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Abbildung 9: Sequenz „Jacke aufmachen“ 


130 sec. 131 sec. 132 sec. 133 sec. 134 sec. 


prene 


Am überall Händler auf der Straße, die die Jacke sagn sag mal brauchst du zwölf Punkte für 
aufmachen so Max ja? 
TC 135 sec. 136 sec. 137 sec. 138 sec. 139 sec. 


Am isch habbe dabei hier und ähh 
Pmf @(.)@ 


fantastisch wir ham ne Schifffahrt gemacht 


3.4.2 Montage und Farbkontraste 


Die Interpretation der Montage bzw. Bildmischung ist insbesondere zur Re- 
konstruktion jener Filme und Videos erforderlich, die Produkte professionel- 
ler bzw. kommerzieller Film- bzw. Videoproduktionen darstellen sowie prin- 
zipiell auf die Massenkommunikation gerichtet sind. Derartiges Fallmaterial 
durchläuft von der Planung bis zur Postproduktion vielzählige Stationen, über 
die sich der kollektive Habitus der abbildenden Bildproduzent/inn/en im 
Material verdichtet. Der Ort, an dem sich dieses hohe Maß an Aufmerksam- 
keit seitens der abbildenden Bildproduzent/inn/en vorrangig dokumentiert, ist 
nach Auffassung der Filmwissenschaft (etwa: Mikos, 2003; Pudowkin, 1999; 
Schumm, 2004; Wiedemann, 2005) die Montage. Diese wird als wesent- 
lichstes Instrument zur Schaffung der filmischen Gesamtkomposition ange- 
sehen. 

Im Videotranskript findet die Montage in der Bilddimension auf zweier- 
lei Arten Ausdruck: zum einen in den Schnitten zwischen den Einstellungen, 
zum anderen in den Farb- bzw. Helligkeitskontrasten, die durch diese Schnit- 
te hervorgerufen werden. In Abbildung 6 erfolgen etwa zum einen Schnitte 
beim Sequenzwechsel zur ES am Ubergang von sec. 104 zu sec. 105, zum 
anderen beim Sequenzwechsel zur US am Ubergang von sec. 139 zu sec. 
140. Der Einstellungswechsel des Fotogramms von sec. 104 zu sec. 105 ist 
eher unauffallig, da der Ubergang mit keinem Farb- bzw. Helligkeitswechsel 
einhergeht. Demgegenüber fällt der Schnitt beim Sequenzwechsel 139-140 
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sec. deutlicher aus, da hier sowohl Farbtöne als auch Helligkeitswerte der 
aufeinanderfolgenden Einstellungen eine Veränderung erfahren”: Die Unter- 
sequenz (140-143 sec.) ist dunkler und ,,violetter“ als der Rest der Hauptse- 
quenz. 

Des Weiteren dokumentiert sich die Montage (und damit die Eingriffe 
der abbildenen Bildproduzent/inn/en) im Videotranskript auch an den Stellen, 
wo Bild- und Tondimension technisch entkoppelt werden. Im vorliegenden 
Beispiel ist etwa beim Einstellungswechsel von Hauptsequenz (HS) zu ein- 
gelagerter (ES) oder Untersequenz (US) zwar ein Wechsel in der Bilddimen- 
sion zu beobachten, aber keiner in der Tondimension. Die Stimme des Mode- 
rators ist durchgehend zu hören, was ein weiterer formaler Beleg für seine 
zentrale Bedeutung im Video ist. 

Bei Videos, die zu Forschungszwecken erstellt wurden, spielt die Mon- 
tage in der Regel keine wesentliche Rolle. Die Leistungen der abbildenden 
Bildproduzent/inn/en — der Forscher/innen — beschränken sich meist auf die 
Wahl des Kamerastandorts und -ausschnitts. Diese Beiträge von Seiten der 
Forscher/innen sollten im Sinne eines methodisch kontrollierten Fremdver- 
stehens reflektiert werden. Da prinzipiell jedoch die Leistungen der abgebil- 
deten Bildproduzent/inn/en das vorrangige Interesse der Forscher/innen dar- 
stellen, versuchen Letztere in der Regel nicht weiter in die Gestaltung des 
Materials einzugreifen.” Wenngleich das Erfordernis der Rekonstruktion der 
Montage mithilfe von Videotranskripten im Falle von Videos, welche zu 
Forschungszwecken aufgenommen wurden, wegfällt, können diese hier je- 
doch eine wesentliche Unterstützung beim Aufspüren, Dokumentieren und 
Rekonstruieren fokussierter Gesten bzw. Gebärden der abgebildeten Bildpro- 
duzent/inn/en sein. 

Einen beachtenswerten Spezialfall hinsichtlich der Rekonstruktion der 
Montage stellen Amateur- bzw. Privatvideos dar (etwa: Baltruschat, 2010). In 
Hinblick auf die Verwendung des Instrumentariums des Schnitts unterschei- 
den sich Amateurvideos nicht grundsätzlich von professionellen Video- oder 
Filmproduktionen, weshalb die Rekonstruktion der Montage auch für diese 
Materialgattung wesentlich erscheint. 

Ein maßgeblicher Unterschied zwischen professionellen und amateur- 
haften Videoproduktionen besteht laut Frost (2009) in der Farbkomposition. 
Während diese bei Amateurvideos eher zufällig entsteht oder bestenfalls 
intuitiv über das Arrangement der Einstellungen erfolgt, werden die Farben 


37 Noch weit drastischere Schnitteffekte sind durch die Montage von Einstellungen zu errei- 
chen, die zueinander farblich oder helligkeitsmäßig in einem komplementären Verhältnis 
stehen (Kap. 8.3.1). 

38 Eine Ausnahme stellt der ethnografische Zugang von Mohn (2011, S. 95) dar, die „fokus- 
siertes Schneiden“ durch die Forscher/innen als erkenntnisgenerierende Option hervorhebt. 
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in professionellen Filmproduktionen oft bereits im Drehbuch festgelegt.” 
Dies geht laut Frost (2009) sogar so weit, dass Farben und Farbkontraste für 
bestimmte Filmgenres typisch geworden sind. Dadurch ist die Farbwahl in- 
dexikal und kann in dieser Weise auch als visuelles Zitat eingesetzt werden.” 
Da sich Farben, Farbkontraste und Helligkeitswerte als visuelle Muster in 
Videotranskripten dokumentieren, können diese im Zuge der komparativen 
Analyse auch miteinander verglichen werden. In Kapitel 5 habe ich durch 
systematischen Vergleich des Videotranskripts der Sendung „Istanbul Total“ 
(TC 00-99 sec.) mit Transkripten anderer Fernsehsendungen demonstrieren, 
dass die feststellbar geringe Schnittanzahl in Kombination mit der zentralen 
Moderatorstellung ein typisches Merkmal der Gattung Late-Night-Show ist. 
In Anknüpfung an diese Vorgehensweise könnte auf der Basis des vorliegen- 
den Videotranskripts nun ein weiterer Schritt die Untersuchung der Indexi- 
kalität der Farben des Fallmaterials sein. Laut Frost (2009) sind kräftige Far- 
ben jedenfalls als typisches Merkmal von Hollywood-Komödien anzusehen. 
Die empirische Überprüfung dieser Aussage könnte durch einen syste- 
matischen Vergleich des Fallmaterials (Abbildung 6) mit Videotranskripten 
von ebensolchen Komödien geleistet werden. 


3.5 Anonymisierung 


Im Rahmen der Auseinandersetzung mit Film- und Videomaterial aus den 
Massenmedien stellt sich die Frage der Anonymisierung nur in geringem 
Maße. Bei abgebildeten Moderator/inn/en oder anderen Personen des 6ffent- 
lichen Lebens (Politiker/innen, Schauspieler/innen etc.) wird im Allgemeinen 
davon ausgegangen, dass diese mit der massenmedialen Verbreitung ihres 
medialen Auftritts einverstanden sind. In Zweifelsfällen wären zuerst die 
abbildenden Bildproduzent/inn/en gefordert, eine unvorteilhafte oder für die 
Betroffenen problematische Szene aus dem Material zu entfernen, bevor es 
gesendet wird. Fernsehsender und Filmproduktionsstudios sind als abbil- 
dende Bildproduzent/inn/en üblicherweise penibel darauf bedacht, sich recht- 
lich gegenüber den abgebildeten Bildproduzent/inn/en abzusichern. Dies 
geschieht auch gegenüber dem Publikum, das sich in der Regel nicht aus 
Prominenten, sondern Privatpersonen zusammensetzt. Wie ich bereits mehr- 


39 Die Auswahl und systematische Kontrolle von Farben, Farbkontrasten sowie Helligkeitsni- 
veaus stellen laut Frost (2009) und Arnheim (1979) unverzichtbare Mittel der Sinnvermitt- 
lung von professionellen Video- bzw. Filmproduktionen dar, weil diese in wesentlichem 
Maße zur formalen Fokussierung der inhaltlichen Botschaft beitragen. 

40 Wer heute etwa einen Film in Schwarz-Weiß dreht, zitiert damit auch die Ara der Schwarz- 
Weiß-Filme (bspw. „The man who wasn’t there“, 2001, oder „The artist“, 2011). 
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mals selbst erleben konnte, wird man als Zuseher — ohne vorhergehende 
Unterzeichnung einer Einverständniserklärung, in der sämtliche mit der audi- 
ovisuellen Aufzeichnung im Zusammenhang stehende persönliche Bildrechte 
an den Fernsehsender abgetreten werden — gar nicht erst ins Aufnahmestudio 
vorgelassen. 

Anders verhält es sich mit Videomaterial, welches zu Forschungszwe- 
cken erstellt wurde. Dieses sollte sowohl auf der Bild- als auch auf der Text- 
ebene modifiziert werden, um im Sinne des Datenschutzes Außenstehenden 
eine Zuordnung videografisch erfasster Personen und Orte zu verunmögli- 
chen. Hinsichtlich der Datenpräsentation in Publikationen berührt diese For- 
derung auch die Erstellung von Videotranskripten. Während die Anonymisie- 
rung auf der Ebene des Sprechtextes in der Regel bereits durch Veränderun- 
gen der Eigennamen zu erreichen ist, erfordert die Anonymisierung in der 
Bilddimension fortgeschrittene Kenntnisse von Bild- bzw. Videobearbei- 
tungsprogrammen. Das Repertoire an möglichen Eingriffen ins Bild reicht 
vom schlichten Verdecken der Augen der Abgebildeten durch Farbbalken 
(etwa: Bohnsack, 2009, S. 98) über das Weichzeichnen der Gesichtszüge 
(etwa: Dinkelaker & Herrle, 2009), das grobe Verpixeln der Gesichter (Ab- 
bildung 10) bis zur Möglichkeit mittels Bildbearbeitungsprogrammen Foto- 
gramme so zu verändern, dass sie wie Zeichnungen (etwa: Dinkelaker, 2013 
in Bezug auf Chuck Goodwin (0.J.)) aussehen. Von Fall zu Fall wird zu ent- 
scheiden sein, welche der genannten Maßnahmen zur Anonymisierung an- 
gemessen ist. 

Einen Graubereich hinsichtlich des Erfordernisses zur Anonymisierung 
stellen Amateur- oder Privatvideos dar, die zur Auswertung im Rahmen von 
Videointerpretationen herangezogen werden. Selbst wenn die an der Produk- 
tion beteiligten Personen vor und hinter der Kamera ihr Einverständnis zur 
Verwendung des Materials gegeben haben, ist damit noch nicht geklärt, ob 
sie auch mit der Interpretation des Materials einverstanden sind. Videotran- 
skripte sind in besonderem Maße von diesem Umstand berührt, da sie zur 
Abbildung, Auswahl und Interpretation des Datenmaterials herangezogen 
werden können. Es erscheint daher (wie insgesamt in der sozialwissenschaft- 
lichen Forschung) ratsam, auch im Falle einer Einverständniserklärung zu 
anonymisieren. 

Der große Nachteil der Anonymisierung der Daten in der Bilddimension 
ist, dass mit dem Gesicht zwangsläufig auch die interpretationsrelevante 
Mimik der abgebildeten Bildproduzent/inn/en verdeckt wird. Bei optimaler 
Anonymisierung des Bildmaterials (etwa durch grobes Verpixeln) sind oft 
nicht einmal mehr Gebärden gut erkennbar. Dieser Umstand kann durch das 
folgende Beispiel aus der Unterrichtsforschung (Juen, 2012) illustriert wer- 
den, das mir freundlicher Weise von der Autorin zur Verfügung gestellt wur- 
de. Zwar sind die einzelnen Schüler/innen im Bild nach der Anonymisierung 
nach wie vor sichtbar. Wie die nachfolgende Abbildung zeigt, geht dadurch 
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aber gerade der interaktive Gehalt der Sequenz — der durch die Simultaneität 
von Mimik und Gestik bestimmt ist — größtenteils verloren. 


Abbildung 10: Die ersten Minuten des Unterrichts (Juen, 2012) 


59 


4 Zwischenfazit und Einführung in den Empirieteil 


Im Verständnis von Bohnsack (2009, S. 171) sind Videotranskripte nach dem 
System MoViQ — ebenso wie Texttranskripte — zwar als Analyseschritte, 
nicht aber als Explikationen und somit als Interpretationen, sondern lediglich 
als Übertragungen bzw. Wiedergaben von Datenmaterial anzusehen. Im An- 
schluss daran wurde anhand der Darstellung der Gütekriterien für Tran- 
skriptionssysteme (Przyborski & Wohlrab-Sahr, 2009, S. 164) eine Evaluie- 
rung des Videotranskriptionssystems MoViQ vorgenommen. Als nachteilig 
wurden die hohen technischen Anforderungen der Methode der Videotran- 
skription an die Forscher/innen identifiziert. Mit Hilfe entsprechender Vide- 
otranskriptionssoftware kann die Erstellung von Videotranskripten jedoch 
stark vereinfacht werden. Das Programm MoviScript, das im Rahmen dieser 
Arbeit entwickelt wurde, stellt einen ersten Ansatz dazu dar. 

Wie des Weiteren anhand des Fallbeispiels einer Fernsehsendung deutlich 
gemacht werden konnte, eignen sich MoViQ-Videotranskripte nicht nur zu 
Abbildungs-, sondern auch zu Sampling- und Interpretationszwecken. In 
dieser Eigenschaft ermöglichen sie — in vergleichbarer Weise wie Texttran- 
skripte — zum einen die interindividuelle Kommunikation bei der gemeinsa- 
men Bearbeitung von Fallmaterial im Kontext von Forschungswerkstätten. 
Zum anderen erhöhen sie in bedeutsamer Weise die Nachvollziehbarkeit der 
Interpretationsschritte, indem sie eine simultane sprachlich-bildliche Refe- 
rentialität zu audiovisuellem Fallmaterial herstellen. 

Am Beispiel der Interpretation der Montage konnte der wesentliche Bei- 
trag von Videotranskripten zur Methodenentwicklung deutlich gemacht wer- 
den: Durch die simultane Abbildungsweise von Bildserien und dazu syn- 
chronem Ton bzw. Sprechtext ermöglichen Videotranskripte die Einnahme 
zusätzlicher Betrachterperspektiven gegenüber dem Fallmaterial und damit 
neue Zugänge zu dessen Rekonstruktion. Beispielsweise lassen sich die im 
„Bild“ des Videotranskripts fixierten Montagemuster im Rahmen der kompa- 
rativen Analyse mit anderem Fallmaterial vergleichen, was eine Gattungsbe- 
stimmung ermöglicht. So lässt sich z.B. die ursprünglich rein metatheore- 
tisch fundierte Differenzierung von Videos (Bohnsack, 2009, S. 117), die zu 
Erhebungszwecken erstellt wurden, und solchen, die als private oder öffentli- 
che Alltagsdokumente angesehen werden können, auf der Basis von Video- 
transkripten formal empirisch rekonstruieren. 

Im Zusammenhang mit den drei von Bohnsack (2009) genannten Typen 
von Fallmaterial (Erhebungsinstrument, private bzw. öffentliche Alltagsdo- 
kumente) wurde abschließend noch auf die komplexe Problematik der An- 
onymisierung von Videotranskripten aufmerksam gemacht. Die Verantwor- 
tung der Forscher/innen für die Anonymisierung des Fallmaterials besteht 
nicht nur dann, wenn dieses von ihnen selbst als Erhebungsinstrument produ- 
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ziert wurde. Auch in der Auseinandersetzung mit privaten Alltagsvideos bzw. 
Amateurvideos erscheint es prinzipiell ratsam, zu anonymisieren. Denn selbst 
wenn ein Einverständnis der Bildproduzent/inn/en zur Verwendung des 
Fallmaterials im Rahmen wissenschaftlicher Arbeit vorliegt, ist damit noch 
nicht automatisch ein Einverständnis zu dessen Interpretation verbunden. 
Eine wesentliche Schwierigkeit der Anonymisierung hat formale Gründe und 
betrifft die Bilddimension. Im Gegensatz zur Anonymisierung in der Textdi- 
mension kann durch Anonymisierung der Bilddimension die Aussagekraft 
des Fallmaterials stark beeinträchtigt werden. Auch diesbezüglich ist — wie 
ganz allgemein — die Erstellung von Videotranskripten auf die Entwicklung 
neuer technischer Ansätze und geeigneter Softwareunterstützung angewiesen. 

Die Auswahl des empirischen Fallmaterials, anhand dessen ich in der 
Folge meine exemplarischen Videoanalysen vertiefen möchte, wurde grund- 
sätzlich nach den Prinzipien des Theoretical Samplings (Przy- 
borski & Wohlrab-Sahr, 2009, S. 177) durchgeführt. Folglich wurden die 
einzelnen Videos dieser Untersuchung nicht zu Beginn festgelegt, sondern 
auf der Basis des methodologischen Erkenntnisinteresses dieser Arbeit Zug 
um Zug nach den Kriterien des maximalen und minimalen Kontrasts ausge- 
sucht. 

Den Ausgangspunkt der Untersuchung stellte die Eingangspassage der 
Fernsehshow „Istanbul Total“ dar. Diese wird in Kapitel fünf im Sinne eines 
minimalen Kontrasts mit zwei anderen Fernsehshows („TV Total“ und Ha- 
rald-Schmidt-Show) sowie im Sinne eines maximalen Kontrasts mit dem 
ZDF-Reisevideo „Reiselust Istanbul“ verglichen. Des Weiteren werden ein- 
zelne Fotogramme der Eingangspassage dazu verwendet, mittels bildgebun- 
dener Suche im Internet planimetrisch ähnliche Bilder zur komparativen 
Analyse aufzuspüren. 

In weiterer Folge wurde in Kapitel sechs ein Ausschnitt aus der türki- 
schen Beyaz-Show zur Interpretation ausgewählt. Dieser Ausschnitt wurde 
am zweiten Sendetag in der Sendung „Istanbul Total“ gezeigt. Aus inhaltli- 
cher Sicht stellt die Beyaz-Show einen minimalen Kontrast zu „Istanbul To- 
tal“ dar. Von methodologischem Interesse ist der Umstand, dass es sich bei 
der Beyaz-Show um eine „Show in der Show“ handelt. Dadurch werden 
Aspekte der Postproduktion sichtbar und interpretierbar. Besondere Auf- 
merksamkeit erfährt dabei die Rekonstruktion der Relation zwischen Bild- 
und Tondimension des Videos. 

Die Auswahl des Musikvideos „Araba“ (1996), das in Kapitel acht unter- 
sucht wird, erfolgte aus zweierlei Gründen. Aus methodologischer Perspek- 
tive stellen Musikvideos einen maximalen Kontrast zu Fernsehshows dar, 
weil sie sich insbesondere hinsichtlich der Montage stark unterscheiden. Des 
Weiteren eignete sich das Musikvideo ,,Araba“ (1996) jedoch aufgrund auch 
besonders gut zur Demonstration von Ittens (2000, 2010) Farbkontrasttheo- 
rie. Aus inhaltlicher Sicht war die Interpretation des Musikvideos von Inte- 
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resse, da eine zweite Bildversion für den internationalen Markt gedreht wur- 
de. 

Im Rahmen eines minimalen Kontrasts wurde abschließend für Kapitel 
neun dieses zweite Musikvideo, „Araba“ (2004), zur komparativen Analyse 
mit dem ersten ausgewählt. Von methodologischem Interesse waren in die- 
sem Zusammenhang insbesondere der Vergleich der Montagen der beiden 
Videos (Araba 1996 und Araba 2004) sowie die Interpretation der an der 
Montage beteiligten Farbkontraste. 
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= = 
total 


Abbildung 11: Videotranskript der Titelsequenz von „Istanbul Total“ (2004), 
2 Bilder/Sekunde. 


Die Titelsequenz einer TV-Show stellt eine besondere kondensierte Fokussie- 
rung des Dokumentsinns der Sendung dar. Im Falle von „Istanbul Total“ 
werden dabei schon innerhalb der ersten 25 Sekunden die zentralen Orientie- 
rungen der Sendung aufgeworfen. So besteht der eigentliche Hauptteil der 
Sequenz ursprünglich aus offiziellem Bildmaterial der türkischen Fremden- 
verkehrswerbung. Dieses wird unverhohlen (mittels großflächiger Einblen- 
dung des TV-Total- bzw. Istanbul-Total-Logos) zum Bestandteil der deut- 
schen Fernseh-Show gemacht. In der Nostrifizierung bzw. Vereinnahmung 
des Fremden bzw. Türkischen dokumentiert sich eine wesentliche Grundten- 
denz der Sendung, die sich wie ein roter Faden durch alle Folgen zieht. 


Anmerkung: Der Schriftzug „Best of“ wurde der DVD-Version der Sendung 
nachträglich hinzugefügt. 
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5 „Istanbul Total“: Eingangspassage 


In diesem Kapitel möchte ich zum einen in das ausgewählte Fallmaterial und 
zum anderen in die Forschungslogik der Film- und Videointerpretation nach 
der dokumentarischen Methode einführen. Vorausschickend ist anzumerken, 
dass ich dazu vorläufig noch nicht vollständig in die einzelnen Arbeitsschritte 
nach Bohnsack (2009, S. 176) eintauche, sondern mich zuerst den medialen 
Eigenschaften des Videomaterials sowie den damit verbundenen empirischen 
Ansatzmöglichkeiten für die Interpretation widme. Dieses Kapitel kann damit 
gewissermaßen als eine Vorrede zur Film- bzw. Videointerpretation verstan- 
den werden, die den Zweck hat für die empirischen Möglichkeiten des damit 
verbundenen Forschungsprogramms zu begeistern. Mein Beitrag richtet sich 
nicht zuletzt an all jene, denen aufgrund von zu geringer persönlicher For- 
schungserfahrung im Umgang mit Film- bzw. Videomaterial ein unmittelba- 
rer Einstieg in die Materie bisher schwergefallen ist. In diesem Zusammen- 
hang kann das hier vorgestellte Repertoire an Interpretationsinstrumenten für 
Studierende und „Neuankömmlinge“ in der dokumentarischen Methode auch 
als eine Art Kompass oder „Grundbaukasten“ für eigene erste Schritte in das 
Feld begriffen werden. Zugleich würde ich mich freuen, wenn dieses Kapitel 
auch als Inspirationsquelle für erfahrene Forscher/innen dienen könnte. In 
diesem Zusammenhang können die hier vorgestellten Versuche als Anregung 
zur eigenständigen Weiterentwicklung der methodischen Instrumente im 
Rahmen der dokumentarischen Methode aufgefasst werden.” Der folgende 
Text stellt eine aktualisierte Fassung meiner bereits an anderer Stelle entwi- 
ckelten Überlegungen (Baltruschat & Hampl, 2013; Hampl, 2010) dar, die 
ich im Kontext der vorliegenden Gesamtarbeit zusammengefügt und noch- 
mals überarbeitet habe. 

Methodologisch beziehe ich mich dabei auf die begrifflichen Konzepte 
und analytischen Einteilungen, die Ralf Bohnsack (2009) — unter Berufung 
auf Erwin Panofsky und Max Imdahl — für die qualitative Bild- und Videoin- 
terpretation nach der dokumentarischen Methode erarbeitet hat.” Der Vorteil 
der dokumentarischen Methode besteht meines Erachtens in der anschauli- 
chen Möglichkeit, Videointerpretationen im Medium des Fallmaterials 
durchzuführen. Videos können mittels Internetsuche rasch und direkt mit 


41 Im vorliegenden Fall wird anhand von konkretem Fallmaterial beispielsweise u.a. die 
bereits im Kapitel „Zur Montage“ vorgestellte Grundidee der Übertragung des Im- 
dahl’schen Prinzips der Kompositionsvariation (Imdahl, 1994) auf die Film- und Videoin- 
terpretation exploriert. 

42 Zur vorbereitenden Lektüre gehörten auch Arbeiten aus den Bereichen der objektiven 
Hermeneutik und hermeneutischen Wissenssoziologie (etwa: Dinkelaker & Herrle, 2009; 
Herrle, 2007; Knoblauch, 2004; Raab, 2008; Schnettler, 2007; Schnettler & Raab, 2008; 
Schnettler, Tuma & Schreiber, 2010). 
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anderen Videos und Bildern verglichen werden, ohne jeweils den Umweg 
über die Textebene nehmen zu müssen. 

Der spezifischen Eigenlogik (bewegter) Bilder möchte ich durch eine 
konsequente Orientierung der Arbeitsschritte an der planimetrischen Kompo- 
sition (Kap. 1.2.2) Rechnung tragen, die „die entscheidende Grundlage für 
das ‚sehende Sehen‘“ (Bohnsack, 2007, S. 167) sensu Imdahl (1994) dar- 
stellt. Außerdem wird zu einem möglichst frühen Einsatz der komparativen 
Analyse im Rahmen der Videointerpretation ermutigt, indem diese Vorge- 
hensweise anhand empirischer Montage-, Einstellungs- und Gesten- bzw. 
Gebärdenvariationen demonstriert wird. Auf die Interpretation des 
Sprechtextes sowie außersprachlicher Tonereignisse (Musik, Geräusche etc.) 
wird in diesem Kapitel verzichtet. Das diesbezügliche Prozedere wird jedoch 
an vergleichbarem Fallmaterial (Beyaz-Show) im nächsten Kapitel ausführ- 
lich erläutert. 


5.1 Auswahl und Interpretation von Videosequenzen 


Die Frage der Auswahl geeigneter Einstellungen und Videosequenzen stellt 
für diejenigen, welche in der Methode der Videointerpretation noch unerfah- 
ren sind, die erste größere Hürde dar. Zwar bietet die einschlägige Fachlite- 
ratur grundsätzliche Auskünfte zur Auswahl von Vergleichsmaterial, etwa 
über die Orientierung an „Eingangssequenzen“ und die Formulierung der 
Prinzipien der „Fokussierung“, „Repräsentanz“, „kompositorischen Auffal- 
ligkeiten“ (Bohnsack, 2009, S. 174) oder der „maximalen Kontrastierung“ 
(Raab, 2008, S. 169). Unbeantwortet bleibt dabei jedoch, wie diese Richtli- 
nien ohne eigene empirische Vorerfahrungen am Material angewendet wer- 
den sollen. 

Meiner Erfahrung nach tendieren Studierende oft dazu, die Kluft zwi- 
schen Theorie und Praxis durch ein Mehr an Lektüre überwinden zu wollen. 
Daran ist die Hoffnung geknüpft, sich so „auf sicherem Wege“ dem Material 
zu nähern. Dieses in der Sozialforschung an sich bekannte Problem verschärft 
sich im Bereich der Bild- und Videointerpretation aufgrund des (noch immer 
verbreiteten) mangelnden Vertrauens in die Leistungsfähigkeit der Instru- 
mente. Methodologisch als zentral erachtete Interpretationsschritte, wie etwa 
die Rekonstruktion der planimetrischen Komposition, wirken aus Studieren- 
densicht auf den ersten Blick oft beliebig. Die Angst vor interpretativen 
Willkürakten im Visuellen führt zu einer Klammerung an Texte bzw. an die 
sprachlichen Äußerungen im Material: Mit beträchtlichem Mehraufwand 
werden zusätzliche Common-Sense-Informationen recherchiert und gesam- 
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melt, obgleich daraus keine tiefergehenden empirischen Einsichten über das 
Material zu erwarten sind. 

Um solchen Vermeidungstendenzen gezielt entgegenzusteuern, halte ich 
es für didaktisch sinnvoll, von vornherein eine direkte visuelle Auseinander- 
setzung mit dem Videomaterial zu forcieren. Im Folgenden möchte ich dar- 
stellen, wie dieser Anspruch durch die Suche nach Vergleichshorizonten im 
Medium des (bewegten) Bildes praktisch umgesetzt werden kann. Stellt man 
das eigene Fallmaterial anderen Bildern und Videos gegenüber, so werden 
Gemeinsamkeiten und Eigenheiten oft unmittelbar deutlich und interpretier- 
bar. Die Auswahl ist somit bereits Interpretation — die Interpretation ein Vor- 
gang, der vom empirischen Vergleich lebt. 


5.2 Exemplarische Videointerpretationen 


Um das Sensorium für die Eigengesetzlichkeiten von Bildern und Videos zu 
schärfen, ist intensives Experimentieren mit Fall- und Vergleichsmaterial 
erforderlich. Ich möchte eine Herangehensweise an Videomaterial vorstellen, 
die „von außen nach innen“ über die Variation von Montage, Einstellungen 
und Gesten bzw. Gebärden verläuft. 

Die Montage umfasst laut Bohnsack (2009, S. 158) die Leistungen der 
abbildenden Bildproduzent/inn/en (der Personen hinter der Kamera). Gesten 
und Gebärden umfassen die Leistungen der abgebildeten Bildprodu- 
zent/inn/en (Personen vor der Kamera). Einstellungen sind als gemeinsame 
Produkte von abbildenden und abgebildeten Bildproduzent/inn/en anzusehen. 
Durch Triangulation, d. h. die Betrachtung des Materials aus diesen unter- 
schiedlichen Perspektiven, kann ein differenziertes Verständnis über die 
Sinnstrukturen des Videomaterials in seiner Gesamtheit gewonnen werden. 


5.2.1  Montagevariation und Gattungsanalyse 


Im Anschluss an meine Überlegungen zur Montage in Kapitel 2 möchte ich 
in der Folge ein Vorgehen demonstrieren, bei dem die Interpretation der 
Montage im Medium des Bildes erfolgt. Es wird dabei prinzipiell eine Form 
der komparativen Analyse von Videos favorisiert, die sich an der planimetri- 
schen Komposition (bewegter) Bilder orientiert. Die erste Auswahl von Ver- 


43 Beliebte Beispiele für Recherchen, mit denen die Konfrontation mit dem Videomaterial 
vermieden werden kann: Lesen von Filmrezensionen, Abhören der DVD-Audiokommen- 
tare der Regisseur/innen, Führen von Interviews mit den Drehbuchautor/inn/en etc. 
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gleichsmaterial erfolgt aus didaktischen Gründen dennoch über die ikonogra- 
fische Ebene, d.h. die Ebene des Common Sense, da diese für Einstei- 
ger/innen am zugänglichsten ist. 

Videointerpretation wird von Angela Keppler (2006, S. 139; zitiert nach 
Bohnsack, 2009, S. 240) im Wesentlichen als Gattungsanalyse begriffen: Im 
Forschungsprozess wird nicht nur ein tieferes Verständnis über das Fallmate- 
rial allein entwickelt, sondern es lassen sich dabei auch Gattungskriterien 
empirisch definieren (Keppler, 2006, S. 139). In Umkehrung des Vorgangs 
kann eine auf ikonografischer Ebene vorgenommene Einordnung des Fall- 
materials in eine Gattung — im Sinne einer Bestimmung des Gattungsthemas 
(Bohnsack, 2003, S. 101) — als Suchhilfe eingesetzt werden. So entspricht im 
vorliegenden Fall die Fernsehsendung „Istanbul Total“ ikonografisch der 
Gattung moderierte Late-Night-Unterhaltungssendungen”. Gattungsimma- 
nent, d. h. innerhalb derselben Gattung, wurden zwei weitere Sendungen zum 
Vergleich ausgewählt: Die Harald-Schmidt-Show (Abbildung 13) und die 
Sendung „TV Total“ (Abbildung 17), von der „Istanbul Total“ (Abbildung 
12) ein „Ableger“ ist. Da das Vorwissen über die Gattungszuordnung im 
genannten Beispiel deren empirischer Bestimmung vorausgeht, ist es Auf- 
gabe der komparativen Analyse, die a priori festgelegte Gattungszuordnung 
zu überprüfen. Im nächsten Abschnitt wird das genaue Prozedere vorgeführt. 

Es kann vorkommen, dass Gattungszuordnungen, die auf der Common- 
Sense-Ebene plausibel und klar erschienen, auf der Ebene der formalen Bild- 
und Textstruktur des Videomaterials nicht überzeugen bzw. sich aus dem 
Material heraus Anknüpfungspunkte zu anderen Gattungen ergeben. Damit 
bietet das gattungsimmanente Vorgehen Ansatzpunkte für gattungsübergrei- 
fende komparative Analysen — für Letztere wurde das Reisevideo „Reiselust 
Istanbul“ (Abbildung 15) als Beispiel herangezogen. In der Folge sind die 
ersten 1:40 Minuten der Sendung „Istanbul Total“ als Videotranskript darge- 
stellt. Auf der linken Seite ist jeweils das fortlaufende Videotranskript der 
Eingangspassage zu sehen, welche das Ausgangsmaterial der vorliegenden 
Videointerpretation bildet. Auf der rechten Seite sind zur komparativen Ana- 
lyse Vergleichssequenzen abgebildet. Diese Form der gegenüberliegenden 
Darstellung im Buch ermöglicht es, das Verhältnis von Ausgangssequenz und 
Vergleichsmaterial besonders zu verdeutlichen. 


44 Diese Gattung stammt ursprünglich aus den USA. Die Sendungen werden in der Regel 
spätabends ausgestrahlt und von einem Moderator in Anzug und Krawatte präsentiert. 
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Passage (oder Sequenz): |Eingangspassage 
Film (oder Video): Istanbul Total 
Dateiname: Istanbul Total.wmv 
Datum der Transkription: [03.05.2009 
Time Code: 00 - 382 
Dauer: 382 sec. 
Transkription: Stefan Hampl 
Korrektur: - 
TC 0 sec. 1 sec. 2 sec, i 3 sec. 4 sec. 


Am Ich befinde mich hier | ähm 
Geräusche ( 
TC 5 sec. 5 6 sec. 7 sec. 8 sec. 9 sec. 


> Ee r = ad 
Am n kann hier hat man einen fantastischen Blick über die ganze Stadt 
Gerausche (Motorengerausche) ) 
TC 10 sec. 11 sec. 12 sec. 13 sec. 14 sec. 
Am Bosporus hier geht's ins goldene Horn ja? Die Schiffe fahren rein s 
Geräusche 
TC 15 sec. 16 sec. 17 sec. 18 sec. 19 sec. 
Am ie fahren raus ein ständiges Heckmeck ja? und äh da drüben kann man fantastisch 
Geräusche 
20 sec. 21 sec. 22 sec. 23 sec 
Am äh ähm die Moscheen sehen da vorne ist die Hagia Sofia eine der ält 
Geräusche 
25 sec. 26 sec. 27 sec. 28 sec. 
Am esten Kirchen äh hier in Istanbul ähm gla'b über tausend Jahre a 
Geräusche 


Abbildung 12: Istanbul Total (1/3) 


72 


Passage (oder Sequenz): |Eingangspassage 

Film (oder Video): Harald Schmidt Show 

Dateiname: Harald Schmidt.avi 

Datum der Transkription: |15.06.2009 

Time Code: 00 - 69 

Dauer: 69 sec. 

Transkription: Stefan Hampl 

TC 0 sec. 1 sec. 2 sec. 3 sec. 4 sec. 


Am Willkommen bitte um Verständnis für Sie zu Hause dass ich den Text hier aber im neuen 
oben ablese Stud 

Pmf ((verebbender Applaus)) @@ 

TC 5 sec. 6 sec. 7 sec. 8 sec. 9 sec. 


Am io läuft der Text hier oben rechts auf einem Laufband Herzlich willkomme 
Pmf @@@@ 

10 sec. 11 sec. 12 sec. 13 sec. 3 14 sec. 
Am n hier im wie es jetzt neu heißt off=ziell im Ersten im Palast der Republik @((ha ha ha)) 
Pmf @@ 


TC 15 sec. 16 sec. 17 sec. 18 sec. 19 sec. 


Am @ Neu aufgebaut und mich ham viele Leute heut angesimst und a 
Pmf @ 
24 sec. 


TC 20 sec. 21 sec. 22 sec. 23 sec. 


Am nge-MMSt Faxe geschrieben und auch persönlich vorbeigekommen und gefragt was is eigentlich 
und äh oben im alten Studio ich weiß es ni 


25 sec. 26 sec. 27 sec. 28 sec. 29 sec. 


TC 


Am cht aber ich habe vorhin gesehen es kam der ich glaube in unserem alten Studio genau hier in 
Möbelwagen unserm Studio vier- 


Bm ja 


Abbildung 13: Harald-Schmidt-Show 
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TC 30 sec. 31 sec. 32 sec. 33 sec. 34 sec. 


Am It und äh daneben ist der Sultanspalast dort vorne auf dieser Anhöhe 


ja? und wenn ma 
en 
35 sec. 36 sec. 37 sec. 38 sec. 39 sec. 


n mal auf die andere Seite rüberschaut dann kann man den Bosporus entla 
BEER 
TC 40 sec. 41 sec. 42 sec. 43 sec. 44 sec. 


Am l ng kucken und sieht dort hinten die Bosporusbrücke die Asien und Europa mi 
Geräusche 
TC 45 sec. 46 sec. 47 sec. 48 sec. 49 sec. 
Am teinander verbindet ja? die einzige Stadt der Welt auf zwei Kontinenten 
Geräusche 
l Ge = 
Am da vorne kommt gerade ein Schlepper an 
Geräusche ( 
TC 55 sec. 56 sec. 


57 sec. 58 sec. 59 sec. 


Am sieht man hier unten das sieht man das sind immer die Boote die Boote mit den kann 
man das mal zeigen? die Boote mit diesen 
Geräusche Motorengeräusch)) 


TC 60 sec. 61 sec. 


Am mit diesen Reifen die schl= die schleppen immer die großen äh Schiffe deswegn 


Abbildung 14: „Istanbul Total“ (2/3) 
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Passage (oder Sequenz): 


Film (oder Video): 
Dateiname: 


Beyoglu 
ZDF Reiselust Istanbul 
Reiselust.mpg 


Datum der Transkription: [25.06.2009 
Time Code: 00 - 55 
Dauer: 55 sec. 
Transkription: Stefan Hampl 
Korrektur: + 
TG O sec. 2 sec. 3 sec. 


Am 
Bm 
TC 5 sec. 


Am 


Beyoglu 24 saat yasar... ((spricht auf Türkisch)) 


Beyoglu lebt vier 


6 sec. 7 sec. 8 sec. 9 sec. 


Bm undzwanzig Stunden am Tag. 


TC 


Am 
Bm 
TC 


Am 
Bm assen 
Geräusche 


TC 20 sec. 


Am 
Bm rants 
TE 


Am 


spricht weiter auf Türkisch; Lautstärke leiser geregelt)) 
Hier gibt es alles soziale kulturelle und 


Kino Theater Bars Restau 
((Läuten)) 


21 sec. 22 sec. 23 sec. 24 sec. 


Bm glu das Unterhaltungszentrum Istanbuls und der Türkei 


Abbildung 15: Reiselust Istanbul 
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TC 65 sec. 66 sec. 67 sec. 68 sec. 69 sec. 


Am gibt's auch hier den äh Spruch Nepper-Schlepper-Bauernfänger @ja@ ja und hier war vielle 
Geräusche ((Mot 

Pmf @(1)@ 

TC 70 sec. 71 sec. 72 sec. 73 sec. 74 sec. 

Am icht was los ich weiß nicht wie das bei Ihnen war ein fantastisches ein 

Fußballwochenende oder? großartige 

Geräusche orengeräusche)) 

TC 75 sec. 76 sec. 77 sec. 78 sec. 79 sec. 

Am r Auswärtssieg und damit vorzeitig Meister herzlichen Glückwunsch Fenerbahce Istanbul 

TC 80 sec. 81 sec. 82 sec. 83 sec. 84 sec. 

Am übrigens 

Pmf Gejohle, Klats 

TC 85 sec. 86 sec. 87 sec. 88 sec. 89 sec. 

Am die Mannschaft von sep 

Pmf chen und Pfeiffen 

TC 90 sec. 91 sec. 92 sec. 93 sec. 94 sec. 

Am die Mannschaft von 

TC 

Am Christoph Daum ist vorzeitig Meister geworden hier in der Türkei Fenerbahce liegt übrigens drüben 


auf der asiatischen Seite 


Abbildung 16: Istanbul Total (3/3) 
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Passage (oder Sequenz): |Eingangspassage 
Film (oder Video): ITV Total 
Dateiname: ITV Total.avi 
Datum: 24.03.2010 
Time Code: 00 - 513 
Dauer: 513 sec. 
Transkription: Stefan Hampl 
Korrektur: + 

TG 


O sec. 1 sec. 2 sec. 3 sec. 4 sec. 


Am Erst einmal möchte ich Ihnen eine Schlagzeile zeigen vom Folgendes Sesamstraße Gibt's jetzt 

heutigen Tage auch 
Pmf @@ @ 
TC 5 sec. 6 sec. 7 sec. 8 sec. 9 sec. 


Am in Afghanistan kein Scherz es gibt jetzt auch 


10 sec. 11 sec. 12 sec. 13 sec. 14 sec. 


Am “= Sesamstraße in — - ja? die erste Straße in Afghanistan übrigens ja? und die äh 
Pmf @ 
TC 15 sec. 16 sec. 17 sec. 18 sec. 19 sec. 


Am i j j i i Bildungsfernsehe 


TC 20 sec. 21 sec. 22 sec. 23 sec. 24 sec. 


Amn ja da sehn die Kinder dann auch Graf Zahl ja? wie=er sagt eins 
Pmf 
TE 25 sec. 


26 sec. 27 sec. 28 sec. 29 sec. 


Am zwei drei vier fünf nachladen ja? 
Pmf @@@ 


Abbildung 17: TV Total 
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a) Gattungsimmanenter Vergleich 


Der gattungsimmanente Vergleich bietet sich ideal als erster Einstieg in die 
Praxis der Videointerpretation an. Dabei wird die Auswahl von Vergleichs- 
material anhand von inhaltlichen Kriterien auf ikonografischer Ebene vorge- 
nommen. Die Fernsehsendung „Istanbul Total“, die hier als Ausgangsmate- 
rial der Videointerpretation dient, lässt sich ikonografisch als Fernsehshow, 
oder noch spezifischer als Late-Night-Show, klassifizieren. Dazu passend 
wurden die Harald-Schmidt-Show sowie die Sendung „TV Total“ als weitere 
Vertreter dieses Sendungstyps ausgewählt. 

Nachdem die Gattungszugehörigkeit als ikonografisches Auswahlkrite- 
rium für Vergleichsmaterial gedient hat, ist in weiterer Folge die empirische 
Überprüfung dieser Zuordnung erforderlich. Aus forschungsökonomischen 
und didaktischen Überlegungen empfiehlt es sich, die methodische Kontrolle 
auf der Ebene der planimetrischen Komposition und der Montage zu begin- 
nen, da so das Fallmaterial als visuelles Ganzes (Deleuze, 1996) besser ver- 
standen werden kann. 

Bei einer ersten Betrachtung der Videotranskripte (Abbildung 12) wird 
hinsichtlich der Montage der Eingangspassage der Harald-Schmidt-Show 
(Abbildung 13) deutlich, dass diese mit einer einzigen Einstellung auskommt. 
Darin ist der Moderator im Bild zu sehen. Zur leichteren Verständigung wird 
diese Einstellung aufgrund ihrer konstitutionellen Bedeutung für die Sequenz 
als Hauptsequenz (Bohnsack, 2009, S. 196) bzw. Haupteinstellung bezeich- 
net. 

Empirisch charakterisieren sich Sequenzen und Einstellungen auf for- 
maler Ebene zuallererst durch planimetrische Gestaltungselemente, die im 
Sinne einer Übergegensätzlichkeit (Bohnsack, 2009, S. 36; Imdahl, 1994, 
S. 312; Ruck & Slunecko, 2008) das visuelle Geschehen bestimmen. Laut 
den genannten Autoren bezeichnen Übergegensätzlichkeiten besondere 
Spannungsverhältnisse, die typisch für visuelle Medien sind und letztlich den 
Schlüssel zu deren empirischem Verständnis darstellen: Charakteristisch ist 
die gleichzeitige Erzeugung und Lösung von Spannungen, durch die sich die 
Kernaussage des (bewegten) Bildes bestimmt. 

In Abbildung 13 resultiert die planimetrische Spannung der Hauptein- 
stellung der Harald-Schmidt-Show (unter Einbeziehung vorikonografischen 
Wissens) aus der horizontalen, dunklen Schichtung des Hintergrundes und 
der dazu vertikal aufgerichteten, hell akzentuierten Person im Vordergrund. 
Die Person im Bild (ikonografisch: der Moderator) durchbricht einerseits die 
horizontale Grundstruktur dunkler Farbtöne (Blau-Schwarz-Rot) durch ihre 
aufrechte Gestalt, ihre hellen Körpermerkmale (Kopf, Hemd, Hände) sowie 
ihre Arm- und Rumpfbewegungen (gegenüber dem unbewegten Hinter- 
grund). Andererseits nimmt die Figur des Moderators (im Sinne einer Lö- 
sung) auch zentrale Umgebungsaspekte in sich auf: dunkle Farbtöne durch 
das schwarze Jackett, die Schichtlinien des Hintergrunds durch die horizon- 
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talen Kontrastlinien von Kinn- und Handansatz sowie die Brille, die Unbe- 
wegtheit des Hintergrundes durch minimale Rumpfbewegungen und Sym- 
metrie. Planimetrisch wird die Spannung in Bild und Sequenz damit von der 
Gestalt des Moderators sowohl induziert als auch reduziert — und somit in 
Form einer Übergegensätzlichkeit fokussiert. 

Stellt man die Eingangspassagen von „Istanbul Total“ und der Harald- 
Schmidt-Show einander gegenüber, so dokumentiert sich auf der Ebene der 
häufigsten Einstellung (Abbildung 12: Sekunden 0, 16-23, 49-57, 65-67, 
69-81, 88-99) eine homologe, d.h. vergleichbare, planimetrische Fokussie- 
rung, in der der Moderator bildbestimmend ist. Homologien bestehen auch 
auf der Ebene der Perspektive: Diese ist in beiden Fällen flach (ohne Flucht- 
linien, d. h. räumliche Tiefenachsen). Es handelt sich um eine Parallelper- 
spektive, die sich aus einer zu Moderator und Umgebung rechtwinkligen 
Kameraposition ergibt. Aufgrund kleiner perspektivischer Verzerrungen an 
den Bildrändern (Harald-Schmidt-Show: gelber Vorhang links im Bild, „Is- 
tanbul Total“: gekrümmtes Balkongitter unten) lässt sich in beiden Fällen 
eine Aufnahmeposition im oberen Bilddrittel (etwa auf Kopfhöhe) sowie ein 
leicht abwärtsgeneigter Blickwinkel rekonstruieren. Schließlich bestehen 
auch auf der Ebene der szenischen Choreografie deutliche Übereinstimmun- 
gen: Beide Moderatoren sind körperlich den Bildbetrachter/inne/n weitge- 
hend zugewandt und deuten mit ihren Händen in verschiedene Richtungen. 
Wie in Abbildung 17 zu sehen, dokumentiert sich die — auf allen drei Ebenen 
der formalen Komposition des Bildes — festgehaltene Homologie der Haupt- 
einstellungen von „Istanbul Total“ und der Harald-Schmidt-Show auch in der 
Haupteinstellung der Vergleichssendung „TV Total“. 

Nachdem die Gattungszugehörigkeit zu Beginn der Untersuchung als 
rein ikonografische Suchhilfe gedient hatte, erlaubte die darauf aufbauende 
komparative Analyse eine sendungsübergreifende Charakterisierung von 
Late-Night-Shows. Auf empirischem Wege konnte so die zentrale Stellung 
der Moderator-Hauptsequenz in Eingangssequenzen der Gattung Late-Night- 
Show herausgearbeitet und strukturell charakterisiert werden. Auf der Ebene 
der Montage treten nun zwei grundlegende Gestaltungsaspekte hervor, die für 
die weitere Betrachtung von Interesse sind: erstens, dass sich die Sendung 
„Istanbul Total“ gegenüber Vergleichssequenzen derselben Gattung eingangs 
durch einen weit häufigeren Einstellungswechsel auszeichnet, sowie zwei- 
tens, dass die Frequenz des Einstellungswechsels nach den ersten sechzig 
Sekunden deutlich abnimmt und sich formal den Vergleichsshows annähert 
(Abbildung 16). Im Vorgriff auf die abschließende Gesamtinterpretation 
könnte der zweite Aspekt für die Wirksamkeit der zuvor als zentral identifi- 
zierten Bildstellung des Moderators in der Gattung der Late-Night-Shows 
gewertet werden, zu der die Sendung — nach anfänglicher Abweichung — 
wieder hintendiert. Die Frage, worin diese Abweichung besteht und was sich 
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in ihr dokumentiert, kann durch den gattungsübergreifenden Vergleich ge- 
klärt werden. 


b) Gattungsübergreifender Vergleich 


Der gattungsübergreifende Vergleich von Videosequenzen setzt direkt an den 
planimetrischen Strukturen von Einstellungen und Einstellungswechseln an. 
Die Erweiterung des Konzepts der planimetrischen Komposition auf bewegte 
Bilder wird dabei durch die Lektüre von Max Imdahl (1994, 1996) nahege- 
legt. Er versteht nämlich die planimetrische Komposition als die primordiale 
Totalstruktur des Bildes, die sich durch eine spezifische Konstellation von 
Formen, Farben, Richtungen, Kontrasten, Spannungen, Lösungen und letzt- 
lich Übergegensätzlichkeiten ergibt. Wird anstelle des Standbilds das Be- 
wegtbild betrachtet, so lassen sich im Sinne Imdahls sowohl einzelne Ein- 
stellungswechsel als auch Muster von Einstellungswechseln interpretieren. 
Im Rahmen der Gattungs- und Montageanalyse interessieren aus planimetri- 
scher Sicht etwa Fragen des Kontrasts, der Frequenz bzw. des Rhythmus von 
Einstellungswechseln. Im konkreten forschungspraktischen Vorgehen wird 
dabei nach Vergleichsmaterial gesucht, das dem Ausgangsmaterial auf mög- 
lichst vielen Ebenen planimetrisch ähnlich ist, aber nicht notwendig dersel- 
ben Gattung entspricht. Auf diese Weise können Gattungsgrenzen über- 
schritten und gegebenenfalls neue Gattungstypen festgelegt werden. 

Zu Beginn der gattungsübergreifenden Interpretation können wir uns auf 
ein Ergebnis des vorangegangenen gattungsimmanenten Vergleichs beziehen: 
Die Hauptsequenz von „Istanbul Total“ wird — für Late-Night-Shows unty- 
pisch — auffällig von anderen Sequenzen unterbrochen. Dies betrifft sowohl 
die Frequenz als auch den planimetrischen Bildinhalt der in den Einstel- 
lungswechseln aufeinandertreffenden Einstellungen. 

Sequenzen, die eine Hauptsequenz unterbrechen, können laut Bohnsack 
(2009, S. 162) in Untersequenzen und eingelagerte Sequenzen differenziert 
werden, wobei Untersequenzen im Gegensatz zu eingelagerten Sequenzen als 
Einstellungsvariationen innerhalb der Hauptsequenz aufgefasst werden. Die 
Interpretation der Einstellungen erfolgt im nachfolgenden Kapitel im Rahmen 
einer komparativen Einstellungsvariation. Für die Darstellung der Interpreta- 
tion einzelner Fotogramme, also Standbilder, sei an dieser Stelle auf 
Bohnsack (2009, S. 202) verwiesen. Die Eingangssequenz von „Istanbul 
Total“ besteht aus einer Untersequenz, in der der Moderator in seitlicher 
Totale am Balkon stehend zu sehen ist (Abbildung 12 ff.: 1-11, 29-33, 39— 
43 sec.). Weiters lassen sich zwei Arten von eingelagerten Einstellungen 
unterscheiden: In der einen ist Publikum zu sehen — was, wie sich empirisch 
rekonstruieren ließe, für Late-Night-Shows gattungstypisch ist; in den ande- 
ren sind (entfernte) Bauwerke und Fahrzeuge erkennbar — was für Late- 
Night-Shows gattungsuntypisch ist. Auf der Ebene des Verhältnisses von 
Haupt- bzw. Untersequenzen zu eingelagerten Sequenzen sind somit die 
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ersten sechzig Sekunden von „Istanbul Total“ einem Reisevideo weit ähnli- 
cher als einer Late-Night-Show. 

Im Rahmen der komparativen Analyse der Sendungen „Istanbul Total“ 
und „Reiselust Istanbul“ (15) können Homologien und Kontraste empirisch 
herausgearbeitet werden. In den Haupt- und Untersequenzen beider Sendun- 
gen ist jeweils eine Person im Bild zu sehen, die sich vor einem entfernten 
(Gebäude-) Hintergrund befindet. Die eingelagerten Sequenzen unterscheiden 
sich inhaltlich: Im Gegensatz zu den entfernten, diffusen Objekten in „Istan- 
bul Total“ (z.B. Abbildung 14: 35-38, 44-48, 58-64 sec.) zeigt „Reiselust 
Istanbul“ Menschenmengen (Abbildung 15: 7-11 sec.) und öffentliche 
Transportmittel (Abbildung 15: 12-18 sec.), die klar umrissen sind und den 
Betrachter/inne/n recht nahe kommen. Ikonologisch dokumentiert sich in der 
Sendung „Istanbul Total“ eine Distanzierung gegenüber der Umgebung. 
Diese Distanzierungsleistung kann anhand eines Vergleichs der Hauptein- 
stellungen (z. B. Abbildung 14: 49-57 sec. und Abbildung 15: 0-6 sec.) 
exemplarisch noch weiter ausgeführt werden: Sowohl in „Istanbul Total“ als 
auch in „Reiselust Istanbul“ befinden sich die Sprecher auf Balkonen in er- 
höhter Position. Während der Balkon bei „Reiselust Istanbul“ in der Straße 
der Stadt hängt, ist er bei „Istanbul Total“ über der Stadt und über dem Meer 
angebracht. Der Moderator von „Istanbul Total“ ist sowohl planimetrisch als 
auch perspektivisch (im Rahmen der Untersequenzen) fokussiert. Demge- 
genüber tritt der Sprecher in „Reiselust Istanbul“ planimetrisch zwar durch 
Farbe und Form hervor. Jedoch ist er seitens der abbildenden Bildprodu- 
zent/inn/en deutlich am linken Bildrand angeordnet, sodass rechts das Blick- 
feld frei bleibt und perspektivisch in die Stadt erweitert wird. Im Gegensatz 
zu Late-Night-Shows unterliegen Reisevideos folglich keiner „Monostruktu- 
rierung durch den Showmaster“ bzw. „Hyperzentrierung auf dessen Person“ 
(Bohnsack, 2009, S. 240). Den Menschen und ihren Umgebungen wird in 
Reisevideos mehr Raum gegeben, um ihre eigenen Relevanzstrukturen zu 
entfalten. Dies demonstrieren auch andere im Handel erhältliche Videobei- 
spiele: z. B. „Städtereisen — Istanbul“, „Istanbul On Tour“ oder „Crossing the 
Bridge: The Sound of Istanbul“, ein Dokumentarfilm von Fatih Akin. 

In knapper Form, aber durch die Interpretationen sowie die vorliegenden 
Videotranskripte (Abbildung 12 ff.) gestützt, kann hier der ikonologische 
bzw. ikonische Schluss (Bohnsack, 2007, S. 158 ff.) gezogen werden, dass 
die Sendung ‚Istanbul Total“ zu Beginn deutliche Anleihen beim Genre Rei- 
sevideos nimmt. Erklärbar wird dieses Vorgehen durch den ungewöhnlichen 
Sendestandort in Istanbul, der es erfordert, den Zusehenden die neue (Stu- 
dio-) Umgebung als Teil der Show näher zu erklären. Gleichzeitig unterlie- 
gen Late-Night-Shows wie „Istanbul Total“ gattungs- und produktionsbe- 
dingt einer starken Monostrukturierung durch den Moderator. Ein gattungs- 
immanenter und ein gattungsübergreifender Vergleich fördern die Kompro- 
missbildung zutage, die sich im Verlauf der Sendung dokumentiert: Nachdem 
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in der ersten Sendeminute gattungsuntypisch einige Gebäude und andere 
Umgebungsobjekte hervorgehoben werden, kehrt die Sendung sukzessive zu 
jener prominenten Fokussierung des Moderators im Bild zurück, die für Late- 
Night-Shows üblich ist. Schon von vornherein sind der Aufnahmestandort 
der Kameras sowie die Position des Moderators festgelegt: Das Fernsehstu- 
dio bzw. dessen Balkon ermöglichen einen friktionsfreien Wechsel vom 
Modus des Reisevideos zurück zum Modus der Late-Night-Show. Geradezu 
kompensatorisch verstärkt sich in diesem Zuge gegenüber Reisevideos das 
Prinzip der Distanzierung.” 

Nachdem für das Medium Video eine Form der Kompositionsvariation 
vorgeführt werden konnte, die sich im Sinne einer „Relationierung der Rela- 
tionen“ (Bohnsack, 2009, S. 165) auf den Vergleich der formalen Strukturen 
der Einstellungen und des Einstellungswechsels bezog, wird nun mit der 
Einstellungsvariation ein Verfahren vorgeführt, dass zur Charakterisierung 
der planimetrischen „Grundstimmung“ von Videos dienlich ist. Es geht dabei 
um das Herausarbeiten jener Bildstrukturen, die das Videomaterial sequenz- 
übergreifend in seiner Totalstruktur prägen. 


5.2.2 Einstellungsvariation 


Zur Entwicklung eines tieferen Verständnisses der Gesamtkomposition von 
Bildern schlägt Imdahl (1994) deren experimentelle Veränderung durch die 
Forscher/innen vor. Das von Bohnsack (2001a, S. 77) als „Kompositionsvari- 
ation“ bezeichnete Verfahren lässt sich prinzipiell auch auf die Film- und 
Videointerpretation übertragen. Im Gegensatz zur Bildinterpretation doku- 
mentieren sich Kompositionsleistungen eines Films oder Videos nicht nur auf 
der Ebene des Einzelbildes bzw. Fotogramms, sondern auch auf der von 
Einstellung und Montage. Im Sinne eines differenzierten Verständnisses der 
Kompositionsvariation soll deshalb das Verhältnis zwischen Fotogramm und 
Einstellung näher spezifiziert werden. 


Einstellung und Fotogramm 


Unter dem Begriff der Einstellung versteht Bohnsack (2009, S. 160) die „Art 
der Gestaltung des Bildausschnitts, wie er durch die Kamera geleistet wird“. 
Von daher ist die Einstellung in besonderem Maße durch die Leistungen der 
abbildenden Bildproduzent/inn/en — d.h. der Personen hinter der Kamera — 
definiert. Dieser Umstand hat Konsequenzen für die Interpretation und Kom- 


45 Derselbe Wirkmechanismus dokumentiert sich neben „Istanbul Total“ (2004) bis heute 
auch in anderen Song-Contest-Specials der Sendung „TV-Total“. Das jüngste Beispiel, 
„Unser Star für Oslo“ (2010), wirkt wie eine norwegische Variante von „Istanbul Total“. 
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positionsvariation von Fotogrammen, die zur Rekonstruktion der Einstellung 
ausgewählt werden. Das durch das Medium Film bzw. Video aufgespannte 
Verhältnis von Einstellungen und Fotogrammen markiert eine ontologische 
Differenz zwischen Bild- und Videointerpretation. Während sich in Fotogra- 
fien oder anderen (Stand-)Bildern die Leistungen von abbildenden und abge- 
bildeten Bildproduzent/inn/en in prinzipiell gleichberechtigter Weise doku- 
mentieren, gibt die Einstellung in asymmetrischer Weise den Orientierungs- 
rahmen der abbildenden Bildproduzent/inn/en für die Fotogramme vor, in- 
nerhalb dessen sich die Leistungen der abgebildeten Bildproduzent/inn/en — 
etwa im Bereich der Mimik und Gestik*° — artikulieren können. 

Unter Berücksichtigung der angeführten Einschränkung ist es zusam- 
menfassend möglich, die Kompositionsvariation von Einstellungen mittels 
repräsentativer Fotogramme durchzuführen. Gegenstand der Variation sind 
dabei die Leistungen der abbildenden Bildproduzent/inn/en, die sich auf 
inhaltlicher und formaler Bildebene dokumentieren. In einem ersten Schritt 
kann die Einstellungsvariation fallintern in der Gegenüberstellung ausge- 
wählter Einstellungen des Film- bzw. Videomaterials bestehen. Die für diese 
Einstellungen als repräsentativ ausgewählten Fotogramme wiederum können 
als Ausgangspunkte für die Suche nach Vergleichsbildern außerhalb des 
Fallmaterials dienen. Das genaue Prozedere wird in der Folge dargestellt. 
Zuvor sei noch ein Exkurs über das Internet als technisches Hilfsmittel bei 
der Bildersuche eingefügt. 


Exkurs: Text- und bildgebundene Suche im Internet 


Hinsichtlich der technischen Möglichkeit, mithilfe von Internetsuchmaschi- 
nen zu Vergleichsbildern für die komparative Analyse zu kommen, lassen 
sich prinzipiell zwei Arten von Bildersuche im Internet unterscheiden: Zum 
einen gibt es die klassische textgebundene Suche nach Bildern. Mit ihr kön- 
nen Bilder recherchiert werden, die zuvor beschlagwortet wurden. Gibt man 
als Nutzer/in etwa das Wort „Baum“ ins Suchfeld ein, werden verschiedene 
Bilder von Bäumen angezeigt. Für die Bild- und Videointerpretation besteht 
der Nutzen der textgebundenen Bildersuche in der Möglichkeit mittels 
(vor-)ikonografisch rekonstruierter Kriterien nach anderen Bildern zu suchen, 
die als empirische Vergleichshorizonte genutzt werden können. Die Grenzen 
der textgebundenen Bildersuche liegen in ihrer Orientierung am wiederer- 
kennenden Sehen. Es kann nur nach sprachlichen Begriffen gesucht werden, 
die zuvor aus dem eigenen Material oder gedankenexperimentell entwickelt 
wurden. Der Umweg über die Textebene schränkt bei dieser Suchmethode 
die Möglichkeit zur direkten komparativen Entschlüsselung der Formal- 


46 Zur Interpretation siehe Kap. 5.2.3 bzgl. „Gesten- bzw. Gebärdenvariation“. 
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struktur des Ausgangsbildes ein. In Abbildung 18 sind neben dem Ausgangs- 
bild in „Parallelprojektion“ (Müller, 2012, S. 149) auf der linken Seite zwei 
Bilder aus dem Internet zu sehen, die nach Eingabe der Kriterien „Mann, 
Meer, Balkon“ angezeigt wurden. Dabei werden die Spielräume der textge- 
bundenen Suche sichtbar. Im mittleren Bild etwa ist das Meer gar nicht im 
Bild zu sehen, wenngleich es vorstellbar wäre, dass der Mann vom Balkon 
aus auf das Meer blickt. 


Abbildung 18: Beispiel des Ergebnisses einer textgebundenen Bildersuche. 
Parallelprojektion des Ausgangsbilds auf der linken Seite mit zwei weiteren 
Bildern, die mithilfe der vorikonografischen Suchkriterien „Mann, Meer und 
Balkon“ im Internet gefunden wurden. Quelle der Vergleichsbilder: 
images.google.com 


Einen neueren Ansatz der Bildersuche im Internet stellt die sogenannte Ähn- 
liche-Bilder-Suche bzw. similar image search (vgl. Abbildung 19) dar. Dieses 
Verfahren könnte auch als bildgebundene Suche” bezeichnet werden, da sich 
dabei direkt Bilder durch Bilder suchen lassen. Um die Suche nach Ver- 
gleichsbildern zu starten, ist es nicht erforderlich, einen sprachlichen Suchbe- 
griff einzugeben — vielmehr dient das Ausgangsbild selbst als Suchkriterium. 
Dieses wird von der Suchmaschine zuerst mittels technischer Algorithmen 
auf formale Muster hin (Farben, Formen, Bildaufteilung etc.) untersucht. Auf 
dieser Basis werden den Nutzer/inne/n dann Vergleichsbilder vorgeschlagen, 


47 Hinsichtlich der Favorisierung des direkten Bildvergleichs ist der methodologische Ansatz 
der bildgebundenen Suche prinzipiell mit dem Konzept einer „figurativen Hermeneutik“ 
(Müller, 2012) verwandt. Die Unterschiede der beiden Verfahren liegen in ihren Erkennt- 
niszielen, Analyseeinstellungen sowie den damit verbundenen Arten der Bildzusammen- 
stellung. Indem die „figurative Hermeneutik“ vornehmlich auf die Analyse „körpersprach- 
licher“ Merkmale, „zeichen-symbolische[r] ... Referenzen“ sowie die Gattungsanalyse 
(Müller, 2012, S. 151) abzielt (was der Analyseeinstellung des wiedererkennenden Sehens 
entspricht), erfolgt die Zusammenstellung kontrastiver Vergleichsbilder auf Basis (vor- 
Jikonografischer Kriterien. Demgegenüber erfolgen die Bildzusammenstellungen im Rah- 
men der hier vorgestellten bildgebundenen Suche auf Basis planimetrischer Kriterien (was 
der Analyseeinstellung des sehenden Sehen entspricht). Das vorrangige Erkenntnisziel der 
bildgebundenen Suche besteht in der kontrastiven Vertiefung der formalen Aspekte der 
Ikonik des Bildes. In Komplementarität zu Müller (2012) könnte dieser methodologische 
Ansatz damit ggf. auch als „planimetrische Hermeneutik“ aufgefasst werden. 
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die formal ähnlich aufgebaut sind. Der Vorteil dieser Suchmethode liegt 
darin, dass sie ohne Umweg über die Sprache auskommt und sich rein im 
Medium des Bildes bewegt. Als Nachteil kann die daraus resultierende hohe 
(vor-)ikonografische Heterogenität der Ergebnisse angesehen werden. Da 
sich diese Suchmethode aber im Medium des Bildes selbst vollzieht, steht sie 
insgesamt dem sehenden Sehen näher als die textgebundenen Suche und ist 
für die explorative Generierung von Bildkontrasten ergiebiger. In Abbildung 
19 sind neben dem Ausgangsbild links zwei weitere Bilder zu sehen, die 
hinsichtlich ihrer planimetrischen Gesamtkomposition (Formen, Farben, 
Bildaufteilung; Symmetrie etc.) dem Ausgangsbild nahe kommen. In der 
Parallelprojektion werden unmittelbar mehrere bestimmende formale Ele- 
mente des Ausgangsbildes deutlich: Die auffällige Symmetrie, die Rundheit 
des Turbans, der Kuppel oder des Kopfes im oberen Bilddrittel, der Kom- 
plementärkontrast von Blau-Violett und Gelb-Orange, das starke rechtwink- 
lige Verhältnis von Horizontalität und Vertikalität etc. 


Abbildung 19: Beispiel einer bildgebundenen Suche. Parallelprojektion des 
Ausgangsbilds auf der linken Seite mit zwei weiteren Bildern, die aufgrund 
ihrer ähnlichen planimetrischen Komposition im Internet gefunden wurden. 
Quelle der Vergleichsbilder: images.google.com 


Nach der Darstellung der forschungspraktischen Möglichkeiten der Bildersu- 
che im Internet seien abschließend aber nicht die caveats dieses Zugangs 
verschwiegen. Zum einen zeigt die Internetbildersuche nicht alle möglichen 
Bilder, sondern nur diejenigen, die irgendjemand irgendwann eingegeben 
hat.“” In diesem Zusammenhang ist davon auszugehen, dass ein/e Suchanbie- 
ter/in jede Suchanfrage und jedes Bild, das zu ihm/ihr hochgeladen wird, 
auch speichert. Daher ist der Einsatz der Internetbildersuche für vertrauliches 
oder urheberrechtlich geschütztes Bildmaterial nicht zu empfehlen. Letztlich 
steht hinter dem kostenlosen Suchangebot der privaten Internetsuchanbie- 
ter/innen auch ein ökonomisches Interesse. Es wird jedoch keine transparente 


48 Nach Angaben von www.bildersuche.org (Stand: Juli 2011) sind in der Google-Bildersuche 
bereits über zehn Milliarden Bilder verfügbar, wovon täglich über eine Milliarde abgerufen 
wird. 
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Information darüber zur Verfügung gestellt, inwieweit dies die Ergebnisse 
von Internetsuchen beeinflusst. 

Zusammenfassend kann somit sowohl die text- als auch die bildgebun- 
dene Suche von Vergleichsbildern die komparative Analyse forschungsprak- 
tisch unterstützen und ökonomisieren. Für Forscher/innen ist es jedoch stets 
erforderlich, die Grenzen und Gefahren des Einsatzes dieser technischen 
Möglichkeiten ausreichend zu reflektieren und im Hinblick auf die Auswer- 
tung des eigenen Materials zu berücksichtigen. 


Fallbeispiel 


Für die folgende Einstellungsvariation wurden insgesamt sieben Fotogramme 
der zirka dreieinhalbminütigen Eingangspassage der TV-Sendung „Istanbul 
Total“ ausgewählt. Das Auswahlkriterium war die minimale Variation der 
planimetrischen Grundstruktur des Videomaterials: Planimetrisch gesehen 
stellen der hellblaue Farbton sowie die ausgeprägte Horizontalität und Verti- 
kalität der meisten Einstellungen eine wesentliche Fokussierung dieser TV- 
Sendung dar. Ausgangspunkt der Einstellungsvariation sind nun Einzelbilder, 
in denen diese Fokussierung in kleinen Veränderungen (im Sinne eines mi- 
nimalen Kontrasts) zum Ausdruck kommt. Es handelte sich dabei um die 
Fotogramme der Sekunden 0, 5, 12/44, 24/36 und 79, die in der obersten 
Zeile von Abbildung 20 angeordnet sind. Direkt darunter sind die zugehöri- 
gen Sprechtexte des abgebildeten Bildproduzenten (Am) angeführt.” Unter- 
halb davon sind jeweils planimetrisch ähnliche Bilder zu finden, die nicht 
dem Fallmaterial entstammen, sondern im Internet mittels bildgebundener 
Suche recherchiert wurden.°' Ergänzend zum bekannten Einzeichnen plani- 
metrischer Linien in die Fotogramme hat sich in der Arbeit mit Studierenden 
das Herausarbeiten planimetrischer Strukturen durch planimetrisch homologe 
Vergleichsbilder bewährt. Die Diskussion der planimetrisch-ikonischen 
Grundstruktur des Fallmaterials lässt sich auf diese Weise anschaulich empi- 
risch führen, ohne es dabei zeichnerisch zu verändern.” 


49 Link zum Video:http://tvtotal.prosieben.de/tvtotal/videos/player/index.html?contentld=141 
44 

50 Auch anhand der Interpretation der Textfragmente ließe sich übrigens das Pars-pro-Toto- 
Prinzip demonstrieren. 

51 Im Internet gibt es einige kostenlose Anbieter für die bildgebundene Suche (z. B.: 
http://www.google.com/imghp, http://www.tineye.com/ etc.). Auf diesen Seiten können Fo- 
togramme hochgeladen und dann ähnliche Bilder abgerufen werden. Vom Hochladen ur- 
heberrechtlich geschützten oder vertraulichen Materials sollte Abstand genommen werden, 
da jedes hochgeladene Bild online gespeichert wird. 

52 In Anlehnung an Dagobert Freys Feldtheorie hat Imdahl (1996) zur Verdeutlichung der für 
die Ikonik konstitutiven Planimetrie im Bild das Einzeichnen planimetrischer Linien in das 
Bild vorgeschlagen. Wenngleich Imdahls ursprüngliche Idee die Verdeutlichung dominan- 
ter Bildstrukturen gewesen sein mag, so handelt es sich dabei doch um einen in der Litera- 
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TE 0 sec. 5 sec. _ 12 sec./44 sec. 24 sec./36sec. 79 sec. 


„wie man sehen 
kann“ 


„ältesten Kirchen“/ „Fenerbahçe 


Am| „Ich befinde mich „die andere Seite“ Istanbul“ 


„Asien und Europa“ 


Abbildung 20: Einstellungsvariation von „Istanbul Total“ 


Die Darstellung der Einstellungsvariation orientiert sich am Layout von Vi- 
deotranskripten nach dem System MoViQ (Hampl 2008, 2010; Przy- 
borski & Wohlrab-Sahr 2008), was an der Sprecherspur (Am) erkennbar ist. 
Der Unterschied zu Videotranskripten besteht in den unregelmäßigen Zeitab- 
ständen zwischen den Fotogrammen. Bei 12 sec./44 sec. und 24 sec/36 sec. 
steht ein Fotogramm jeweils für zwei homologe Einstellungen (vgl. Hampl 
2010). 


Fotogramm 0: „Ich befinde mich“ 


Abbildung 21: v.l.n.r. Fotogramm 0, Tagesschau, Urlaubsfoto. Quelle: 
images.google.com 


Die Planimetrie des allerersten Videobildes (Fotogramm 0) wird — wie die 
gesamte restliche Videosequenz — farblich maßgeblich durch eine hellblaue 
Fläche geprägt, die im konkreten Fall horizontal in verschiedenen Blauabstu- 
fungen geschichtet ist (Himmel, Uferlinie, Meer, Balkongitter). Formal hebt 
sich davon farblich sowie durch ihre Lage und Ausrichtung eine braun-weiß- 
goldene Gestalt ab, die senkrecht rechts der Bildmitte aufragt (ikonografisch: 


tur nur vage spezifizierten, konstruktiven Zeichenakt der Forscher/innen, der das ange- 
strebte „sehende Sehen“ einschränken kann. 
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der Moderator” in seiner Verkleidung). Im Sinne einer Übergegensätzlichkeit 
(Imdahl, 1994) wird das Bild - trotz dieser prinzipiell gegensätzlichen Stre- 
bungen — durch horizontale Farbkontraste (Turban bzw. auf Türkisch ,,Sarik“ 
und Bauchbinde) in der Gestalt des Moderators integriert. Die Gestalt des 
Moderators ist somit planimetrisch fokussiert, indem sie einerseits aus dem 
Ensemble farblich und lagemäßig herausfällt, andererseits durch die spezifi- 
schen Akzente ihrer (Ver-)Kleidung jedoch das Bild zusammenhilt. 

Durch die Gegenüberstellung der Vergleichsbilder in Abbildung 21 tritt 
die formale Struktur des Ausgangsbildes (Fotogramm 0) profilierter zutage: 
Sie besteht im farblichen Kontrast von Blau- und komplementären Gelbtö- 
nen, der rechts der Mitte (jeweils klar abgrenzbar) eine schmale, vertikale 
Figur aus dem Bild hervortreten lässt. Wenn Personen im Bild leicht außer- 
halb der Bildmitte angeordnet sind, eröffnet dies den Blick auf den Hinter- 
grund, welcher dadurch thematisiert und im Modus der Gleichzeitigkeit ins 
Verhältnis zur Person im Vordergrund gestellt wird. Wie der Bildvergleich 
zeigt, ist dieser Effekt sowohl in professionellen Bildern (hier aus der Nach- 
richtensendung Tagesschau°*) als auch in amateurhaften Urlaubsfotos reali- 
siert. 


Fotogramm 5: „Wie man sehen kann“ 


Abbildung 22: v.l.n.r. Fotogramm 5, Menschen vor/auf Wohnhaus, Ho- 
telanlage. Quelle: images.google.com 


Planimetrisch ist auch Fotogramm 5 durch seine hellblaue Farbe bestimmt, 
wobei der Farbton insgesamt etwas violetter ist als im Fotogramm 0. Im 
direkten Vergleich ist Fotogramm 5 weniger klar strukturiert und stattdessen 
eher durch kleingliedrige Elemente bestimmt. Wie schon zuvor ist das 90°- 
Verhältnis von Vertikale und Horizontale ein bestimmender Bildaspekt, der 


53 Erklärung: Es handelt sich um den bekannten Entertainer Stefan Raab, der seit über zehn 
Jahren die Sendung „TV Total“ sowie auch deren Ableger (z. B. „Istanbul Total“) mode- 
riert. 

54 Im Falle des Bildes E 0 der ARD-Tagesschau handelt es sich ikonografisch um einen 
stilisierten Hintergrund, also ein Bild im Bild (vgl. Bohnsack 2003, S. 244). 
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sich in den scharfen Kanten der hellblau-weißen rechten oberen Bildhälfte 
dokumentiert. Damit besteht ein Gegensatz zwischen der diffusen Kleinglied- 
rigkeit und der rechtwinkligen Klarheit des Bildes. 

Die Person des Moderators integriert diese beiden Aspekte im Sinne ei- 
ner Übergegensätzlichkeit. Der Moderator fügt sich einerseits durch seine 
eigene Kleinheit in die detailreiche Umgebung ein, ist gleichzeitig aber durch 
einen weißen Farbakzent (Hemd und Turban) markiert. Des Weiteren befin- 
det er sich direkt unterhalb der Stelle, wo horizontale und vertikale Linien 
sich treffen. Damit ist die Person des Moderators zwar erneut planimetrisch 
fokussiert, geht jedoch als Einzelperson in der Umgebung unter. Dieser Ef- 
fekt tritt auch in den planimetrisch homologen Vergleichsbildern von Abbil- 
dung 22 zutage: Die Grenzen zwischen Personen und Gebäuden verschwim- 
men. Hierin zeigt sich ein deutlicher Kontrast der Einstellung von Foto- 
gramm 5 zu jener von Fotogramm 0, welche durch eine klare Farb- und 
Formgebung bestimmt ist. 


Fotogramm 12 bzw. 44: „Asien und Europa“ 


Abbildung 23: v.l.n.r. Fotogramm 12 bzw. 44, Hügelketten im Dunst, Wind- 
surfer am Meer. Quelle: images.google.com 


Die beiden Fotogramme 12 und 44 aus dem Videomaterial sind zueinander 
planimetrisch homolog und werden deshalb gemeinsam betrachtet. Im We- 
sentlichen ist das Bild erneut stark von hellblauen Farbtönen geprägt, die sich 
in horizontaler Schichtung übereinander befinden (Himmel, Ufer, Schiff, 
Meer). Die Farben kontrastieren kaum miteinander. Im rechten Bilddrittel ist 
eine breite, mittelblaue Linie (Brückenpfeiler der Bosporusbrücke) erkenn- 
bar. Diese Linie stellt, zusammen mit dem horizontalen Ufer, eine Homolo- 
gie zu den vorhergehenden Bildern dar. Insgesamt gesehen dominiert hier 
jedoch die horizontale Schichtung gegenüber der Vertikalität, die in den 
Fotogrammen 0 und 5 stärker ausgeprägt war. Planimetrisch fokussiert ist 
damit das Verhältnis „oben — unten“ in verschiedenen Blautönen. Da kein 
Moderator zu sehen ist, wird das Bild durch diese Fokussierung vollständig 
bestimmt und zusammengehalten. Die in Abbildung 23 neben Fotogramm 12 
angeordneten Vergleichsbilder illustrieren den planimetrisch-ikonischen 
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Befund: Himmel, Berge und Meer liegen schichtweise und in atmosphäri- 
sches Blau getüncht übereinander, worin sich eine große Distanz zu den be- 
trachteten Objekten dokumentiert. 


Fotogramme 24 bzw. 36: „ältesten Kirchen“ bzw. „die andere Seite“ 


Abbildung 24: v.l.n.r. Fotogramm 24, Fotogramm 36, Stephansdom in Wien. 
Quelle: images.google.com 


Im vorliegenden Fall werden zwei Fotogramme betrachtet, die zueinander 
hinsichtlich ihres hellblauen Farbtons homolog sind und die beide eine dunk- 
le vertikale (Turm-) Spitze in der rechten Bildhälfte aufweisen. Es bestehen 
jedoch auch Kontraste zwischen den Bildern. Wie die Vergleichsbilder zei- 
gen, unterscheidet sich Fotogramm 24 planimetrisch von Fotogramm 36 
hinsichtlich seiner stärkeren Symmetrie und „Rundheit“ (Kuppeldach). Diese 
Spannung stellt damit die Fokussierung der beiden Bilder dar. Wie das Ver- 
gleichsbild in Abbildung 24 verdeutlicht, dominiert jedoch in beiden Foto- 
grammen letztlich die Turmspitze gegenüber einem niedrigeren Gebäu- 
dekorpus, was insgesamt an christliche Kirchenbauten erinnert. 


Fotogramm 79: „Fenerbahce Istanbul“ 


Abbildung 25: v.l.n.r. Fotogramm 79, Taj Mahal in Indien, Jesusdarstellung 
von Giotto. Quelle: images.google.com 


Das Fotogramm 79 stellt eine Homologie zu Fotogramm 0 dar. Der Unter- 
schied zwischen beiden besteht jedoch darin, dass die Gestalt des Moderators 
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diesmal in das Bildzentrum gerückt ist, wodurch das Bild insgesamt symmet- 
rischer ausfällt. Mit beidseitig waagerecht auf Hüfthöhe ausgestreckten Ar- 
men integriert der Moderator vollständig die bereits bei Fotogramm 0 her- 
ausgearbeiteten Gegensätze zwischen Horizontale und Vertikale sowie zwi- 
schen Hellblau und Weiß. 

Vor dem Hintergrund der vorhergehenden Bilder — und den dabei her- 
ausgearbeiteten gemeinsamen Bildstrukturen (kontrastreich — kontrastarm, 
horizontal — vertikal, oben — unten, rund - spitz, rechtslastig — symmetrisch) 
— zeichnet sich das letzte Fotogramm insbesondere durch die Integration der 
bisher herausgearbeiteten Bildaspekte einerseits sowie die zusätzliche Beto- 
nung von Kontrast und Symmetrie andererseits aus. 

Damit handelt es sich in Fotogramm 79 um eine Metafokussierung, die 
als Ausgangspunkt für die komparative Analyse auf der Ebene der Einstel- 
lungen (,,simultane Performanz“) sowie auch auf der Ebene der Montage 
(„sequenzielle Performanz“) herangezogen werden kann. Der Stellenwert der 
Symmetrie für die Bildgestaltung lässt sich anhand der planimetrisch homo- 
logen Vergleichsbilder in Abbildung 25 demonstrieren. In anderen Bildern 
mit dieser spezifischen Symmetrie dokumentiert sich stets die Metaphorik 
des Majestätischen und Außergewöhnlichen. Wie die Beispiele des palastar- 
tigen indischen Königsgrabes Taj Mahal sowie einer frühmittelalterlichen 
Jesusabbildung”” zeigen, trägt zu diesem Eindruck übrigens auch die spezielle 
Kopfbedeckung des Moderators bei. Diese weist formale Ähnlichkeiten so- 
wohl zum Kuppeldach des Taj Mahal als auch zum Heiligenschein der Jesus- 
darstellung auf. 

In Hinblick auf die Gesamtinterpretation des Videomaterials von ,,Istan- 
bul Total“ (vgl. Bohnsack 2009; Hampl 2010) zeigt der ikonische Vergleich, 
dass der Dokumentsinn der Fotogramme pars pro toto die wesentlichen As- 
pekte des Videomaterials enthält. Auch die Rekonstruktion der Montage 
(Bohnsack 2009; Hampl 2010), die laut Stanley Kubrick das Alleinstel- 
lungsmerkmal von Filmen darstellt (Bohnsack 2009), liefert den empirischen 
Befund, dass ein majestätischer Moderator das Bildgeschehen von „Istanbul 
Total“ dirigiert und sich damit zugleich von der diffusen türkischen Umge- 
bung distanziert, in der er sich befindet. 

Wie die Einstellungsvariation verdeutlicht, ist der Dokumentsinn des Vi- 
deos pars pro toto in allen Fotogrammen des Videos angelegt, jedoch in un- 
terschiedlicher Fokussierung ausgeprägt. Nachdem bei diesem Interpretati- 
onsschritt vor allem die Leistungen der abbildenden Bildproduzent/inn/en im 
Vordergrund standen, soll in weiterer Folge nun eine Technik zur komparati- 
ven Rekonstruktion der Leistungen der abgebildeten Bildproduzent/inn/en 
vorgestellt werden. Wie bereits erwähnt, sind Filme und Videos in höherem 


55 Giotto (1304): Das Jüngste Gericht (Ausschnitt) 
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Maße als Bilder durch die Leistungen der abbildenden Bildproduzent/inn/en 
bestimmt. 

Innerhalb des durch die abbildenden Bildproduzent/inn/en vorgegebenen 
Rahmens besteht für die abgebildeten Bildproduzent/inn/en in der Bilddi- 
mension lediglich auf der Ebene ihrer Körperhaltung (Gebärden) und Gesten 
ein gewisser Gestaltungsspielraum. Mittels des Instruments der Gesten- bzw. 
Gebärdenvariation soll exemplarisch die Interpretation einer besonders auf- 
fälligen Gebärde demonstriert werden. 


5.2.3 Exkurs: Gesten- bzw. Gebärdenvariation 


Aus methodologischer Sicht fällt die Gesten- bzw. Gebärdenvariation ein 
wenig aus der Gesamtlage dieser Arbeit heraus, da sich der analytische Fokus 
dabei sowohl vom sehenden zum wiedererkennenden Sehen als auch von den 
abbildenden zu die abgebildeten Bildproduzent/inn/en verlagert. Hinter die- 
sem Exkurs stehen aber pragmatische Überlegungen. Zum einen lässt sich an 
dieser Stelle gut demonstrieren, wie sich das Grundprinzip der Kompositi- 
onsvariation auch auf andere empirische Instrumente der Bild- bzw. Vi- 
deointerpretation übertragen lässt. Zum anderen stellt die Gesten- bzw. Ge- 
bärdenvariation ein Verfahren dar, das neben Erweiterungsmöglichkeiten für 
die dokumentarische Methode auch Anknüpfungspunkte an andere metho- 
dologische Ansätze, etwa den der „figurativen Hermeneutik“ (Müller, 2012) 
im Rahmen der visuellen Wissenssoziologie (Breckner, 2010; Raab, 2008)“, 
bietet. 

Die Rekonstruktion von Gesten und Gebärden” ist als Bestandteil der 
Videointerpretation sowohl für die Untersuchung von Videomaterial aus 
Massenmedien als auch für die Betrachtung von Videomaterial aus eigenen 
Erhebungen relevant. Die Verwendung von Videotranskripten nach dem 
System MoViQ stellt in diesem Zusammenhang eine große Arbeitserleichte- 
rung dar, sollen Bewegungsabläufe in ihrer Genese Schritt für Schritt festge- 
halten und interpretiert werden.” Wie bereits erwähnt, sind Auffälligkeiten 
und Diskontinuitäten in der Regel Kennzeichen von Fokussierungen im Ma- 
terial (Bohnsack, 2009, S. 215). Die in der Folge betrachtete Geste erstreckt 
sich über das Intervall von Sekunde 131 bis Sekunde 136 (Abbildung 26) und 
wird mit planimetrisch homologen Fotos aus dem Internet (Abbildung 27) 
kontrastiert, um den Dokumentsinn der Geste auf den Punkt zu bringen. 


56 Zur Differenzierung der Begriffe siehe Kap. 3.4.1, Fußnote 36. 

57  Medienhistorisch betrachtet besteht die Möglichkeit des filmischen Festhaltens von Bewe- 
gungsabläufen seit Ende des 19. Jahrhunderts. Unter dem Titel „Animal Locomotion“ 
publizierte der Fotograf Eadweard Muybridge 1887 u. a. seine berühmten Serienfotografien 
(siehe etwa Abbildung 2). 
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Am! weiß nicht wer schon mal auch in Istanbul war von Ihnen ich kann wenn Sie hier kriegen Sie 
Ihnen nur empfehlen fahren Sie hier hin einfach alles 
TC 130 sec. 131 sec. 132 sec. 133 sec. 134 sec. 


Am überall Händler auf der Straße die die Jacke sagn sag mal brauchst du zwölf Punkte für 
aufmachen so Max ja? 


TC 135 sec. 136 sec. 137 sec. 138 sec. 139 sec. 


ry ier ie eye 


Am isch habbe dabei hier und ähh fantastisch wir ham ne Schifffahrt gemacht 
Pmf @(.)@ 


Abbildung 26: Sequenz „Jacke aufmachen“ 


Ban 
AST 


Ee 


Abbildung 27: Vergleichsbilder „Jacke aufmachen“ 


Vorikonografisch betrachtet öffnet der Mann in Abbildung 26 von Sekunde 
131 bis Sekunde 134 seinen Mantel. In Sekunde 135 streckt er seinen Zeige- 
finger aus und richtet ihn auf die Innenseite des Mantels. Auf planimetrischer 
Ebene verändert sich durch den Vorgang des Mantelöffnens die symmetri- 
sche Grundkonstitution der Einstellung: Im Bild entsteht eine dunkle Fläche, 
die sich im Kontext eines starken Schwarz-weiß-Kontrasts wie ein Keil zwi- 
schen den abgebildeten Bildproduzenten und dessen Umgebung schiebt. 
Planimetrisch gesehen erhöht sich durch den Kontrastanstieg die Fokussie- 
rung der Person im Bildvordergrund; nicht nur wird die Person selbst kon- 
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trastreicher und schärfer — auch gegenüber dem Bildhintergrund gewinnt sie 
zusätzlich an Profil. Die planimetrische Einstellungsvariation, bei der das 
Gesamtbild im Fokus steht, lässt sich so in eine Gesten- bzw. Gebärdenvari- 
ation überleiten. Zusätzlich kann es, wie im vorliegenden Fall geschehen, 
hilfreich sein, vorikonografische Kriterien bei der Auswahl der Vergleichs- 
bilder mit einzubeziehen. Für die komparative Analyse wurden somit Ver- 
gleichsbilder gesucht, die der Sequenz der Geste (Abbildung 26, 131-134 
sec.) sowohl planimetrisch als auch vorikonografisch entsprachen. 

Die Vorzüge der empirischen Gesten- bzw. Gebärdenvariation werden 
aus Abbildung 27 ersichtlich. In der Gegenüberstellung der Bilder treten uns 
schon bei flüchtiger Betrachtung — im Sinne eines Pars pro Toto — jene Be- 
deutungshorizonte entgegen, die für die Konstitution der Ausgangsgeste 
(Abbildung 26) relevant sind: Keines der Vergleichsbilder durchdringt die 
Ausgangsgeste vollständig hinsichtlich ihrer Sinnstruktur. Jedoch ermöglicht 
es der Gesamteindruck aller Bilder, mit verschiedenen „Brillen“ auf die Aus- 
gangsgeste zu blicken Vorikonografisch lassen sich unmittelbar folgende 
Bestimmungsmerkmale der Geste identifizieren: Erstens ist in der Sequenz 
eine der Kamera zugewandte Person mit Mantel abgebildet. Diese öffnet 
während einer Bewegung von sieben Sekunden (131-137) mit der rechten 
Hand ihren Mantel und schließt ihn dann wieder. Im Zuge dessen dreht die 
Person ihren Körper den Bildbetrachter/inne/n gegenüber aus einer Frontal- 
position in eine Dreiviertelpose. Dabei neigt sie den Kopf leicht abwärts und 
dreht ihn mit dem Körper mit. Die Augen sind in Position 131 kurz nach 
unten gewandt, bleiben die restliche Zeit der Ausführung der Geste aber 
direkt auf die Bildbetrachter/innen gerichtet. Der geöffnete Zustand des Man- 
tels bleibt drei Sekunden (133-135) lang aufrecht. Die Finger der rechten 
Hand sind dabei auf Brusthöhe der Person zirka eine Unterarmlänge vom 
Körper entfernt. Gleichzeitig vollzieht sich eine Bewegung des linken Arms 
der abgebildeten Person Richtung Mantelinnenseite, die durch das Ausstre- 
cken des linken Zeigefingers abgeschlossen wird. Auf ikonografischer Ebene 
lässt sich diese auffällige Gebärde als Geste des Zeigens identifizieren. 

Die Betrachtung der Vergleichsbilder setzt beim planimetrisch fokus- 
siertesten Element, dem geöffneten Mantel, ein (Abbildung 27). Insgesamt 
sind fünf verschiedene Variationen dieser Grundstruktur dargestellt. Bei 
erster genauerer Inspektion der Bilder fällt auf, dass Arm-, Hand- und Fin- 
gerhaltungen der Ausgangssequenz nicht in allen Vergleichsbildern gegeben 
sind. Sie fehlen etwa in den Bildern Cora und Daniel. Von den verbleibenden 
drei Bildern scheinen auch Birgit und Emil auf den ersten Blick nicht ganz 
zur Ausgangssequenz zu passen, da in ihnen beide Arme angehoben und 
beide Mantelseiten geöffnet sind. Übrig bleibt vorläufig somit nur Anna. Sie 
hat eine Mantelseite mit ihrem Arm geöffnet und blickt frontal in die Ka- 


94 


mera. Was dieser Aufnahme fehlt, ist die spezifische Haltung der anderen 
Hand, die auf ikonografischer Ebene als Zeigen identifiziert werden konnte. 
Im direkten Vergleich zwischen der Ausgangssequenz und Anna wird nun 
deutlich, dass die Idee des Zeigens bereits im reinen Öffnen des Mantels 
enthalten ist. Wie die ikonografische Interpretation der Vergleichsbilder 
ergibt, handelt es sich dabei jedoch um ein Zeigen von gegenüber eines Zei- 
gens auf. Anna und Birgit zeigen ihren Mantel, genauer gesagt dessen Innen- 
seite. Sie zeigen jedoch nicht auf diese Innenseite. Das Zeigen auf die Innen- 
seite des Mantels, wie sie sich in der spezifischen Arm- und Fingerhaltung in 
der Ausgangssequenz dokumentiert, stellt somit eine besondere Fokussierung 
dar. 

Irritierend ist an dieser Stelle, dass auf der Innenseite des Mantels in Ab- 
bildung 26 nichts weiter zu sehen ist als eben der Mantel selbst. Nachdem der 
Mantel selbst nicht gemeint sein kann — da es dazu keines zusätzlichen Zei- 
gens bedürfte — bestehen nun zwei prinzipielle Interpretationsmöglichkeiten: 
Entweder es wird tatsächlich auf nichts gezeigt oder es wird auf etwas ge- 
zeigt, das sich gerade nicht an der bedeuteten Stelle befindet. Phänomenolo- 
gisch betrachtet ist es ein maßgebliches Charakteristikum des Nichts, dass 
sich darauf nicht zeigen lässt. Ein Nichts, auf welches gezeigt wird, ist somit 
indexikal für ein Etwas aufzufassen, das (derzeit) nicht anwesend ist. Im 
Vergleich zum Bild Emil (Abbildung 27) erfährt dieser Gedanke seine kon- 
krete Visualisierung. Emil trägt etwas im Mantel, das sich nicht genau identi- 
fizieren lässt. Formal festzuhalten ist jedoch, dass diese Dinge bei geschlos- 
senem Zustand des Mantels nicht zu sehen sind. Der Träger des Mantels 
entscheidet folglich selbst, ob er dessen Inhalt anderen preisgibt. Andernfalls 
bleibt der Inhalt des Mantels Außenstehenden verborgen. 

Zur vollständigen Rekonstruktion der Geste fehlt nun noch die abschlie- 
Bende Kontextualisierung dieses Mechanismus. Vorikonografisch ist im Bild 
Emil die Strichzeichnung eines Mannes mit Hut, Krawatte, Hemd, Hosenträ- 
gern, Hosen und Schuhen zu sehen. Ikonografisch handelt es sich beim Hut 
um ein Modell der 1930er/40er Jahre — ein Zeitraum, in dem auch die im Bild 
gezeigten Nadelstreifenhosen und Schuhe mit Gamaschen in der westlichen 
Welt verbreitet waren. Der Mantel ist unspezifischer, doch lässt er sich im 
Kontext der übrigen Kleidungsstücke als Trenchcoat identifizieren. Zusam- 
mengefasst ist der Schnitt der dargestellten Kleidung im Grunde typisch für 
die Mode der 1930er/40er Jahre, der Zeit der Prohibition und Weltwirt- 
schaftskrise sowie der Hochblüte des organisierten Verbrechens. Insbeson- 
dere Gamaschen und Nadelstreifen waren typische Accessoires von Mafia- 
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gangstern.” Die betrachtete Geste des Zeigens auf etwas Verborgenes erhält 
in diesem Zusammenhang die Kontextualisierung des kriminellen Aktes, des 
Schwarzhandels. 

Der Moderator der Sendung „Istanbul Total“ trägt kein Mafiakostiim, 
aber auch er ist verkleidet. Wie die ikonografische Betrachtung ergibt, trägt 
er das Kostüm eines osmanischen Sultans. In diesem Zusammenhang wird 
vom abgebildeten Bildproduzenten, dem Moderator Stefan Raab, die Geste 
des Schwarzhändlers in orientalischer Verkleidung dargestellt. Noch über- 
spitzter könnte man formulieren: Osmanische Sultane (und damit das Türki- 
sche an sich) werden mit mafiösen Schwarzmarkthändlern gleichgesetzt. Da 
auf der Mantelinnenseite des als Sultan verkleideten Moderators nichts zu 
sehen ist, erhält die Geste in der Bilddimension den Charakter des Gespiel- 
ten, nicht Ernsthaften. Im Modus des Komischen gelingt die Vermittlung 
stereotyper Inhalte über das Türkische bei gleichzeitiger Vermeidung eines 
ernsten Beigeschmacks. So ermöglichen es Komik, Verkleidung und Rolle 
dem Moderator, zu Inhalten der Sendung „Istanbul Total“ auf Distanz zu 
gehen - insbesondere dann, wenn er diese selbst lanciert hat. Letztlich tritt in 
der Übergegensätzlichkeit der vorgestellten Geste „Jacke aufmachen“ auch 
eine allgemeine Immunisierungsstrategie von Late-Night-Shows hervor: Von 
vornherein haben diese durch die Verkleidung eine Art Distanzierungsfilter 
eingebaut, der Handlungen und Äußerungen des Moderators vor Kritik oder 
Anfechtungen zu schützen vermag (vgl. Hampl 2010). 


5.2.4 Reflektierende Gesamtinterpretation und Zusammenfassung 


Die reflektierende Gesamtinterpretation des Videomaterials von „Istanbul 
Total“ setzt sich aus den Teilergebnissen der komparativen Montage-, Ein- 
stellungs- und Gesten- bzw. Gebärdenvariationen zusammen. Auf der Basis 
des gattungsimmanenten und gattungsübergreifenden empirischen Vergleichs 
der Eingangspassage der Fernsehsendung „Istanbul Total“ mit anderen Sen- 
dungen sowie mit Vergleichsbildern aus dem Internet konnten spezifische 
Sendungs- und Gattungscharakteristika in der Bilddimension herausgearbei- 
tet werden. Dabei haben wir uns dem Material „von außen nach innen“ (d.h. 
von der Interpretation der Montage zu jener der Einstellungen und Gesten 
und Gebärden) genähert. Im Rahmen der Gattungsanalyse ließ sich die 1:40- 
minütige Sequenz von „Istanbul Total“ (Abbildung 12 ff.) als Eingangsse- 
quenz der deutschen Late-Night-Show „TV Total“ identifizieren, wobei sich 


58 Ein weiterführender Hinweis kann auf den Film „Manche mögen's heiß“ (USA, 1959) 
gemacht werden, der im Chicago des Jahres 1929 spielt. Die kriminellen Bösewichte des 
Films sind ebenso in Nadelstreifen und Gamaschen gekleidet. Der Anführer der Bande 
heißt im Film sogar „Gamaschen-Colombo“ oder einfach kurz ,,Gamasche“. 
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auf der Ebene der Montage eine für Eingangspassagen von Late-Night-Shows 
untypische Schnittfolge zeigte: Üblicherweise dominieren nämlich in den 
ersten Minuten von Late-Night-Shows Kameraeinstellungen, in denen der 
Moderator fokussiert ist, oder solche in denen kurz das Publikum eingeblen- 
det wird. Wie mittels des Vergleichs mit der Sendung „Reiselust Istanbul“ 
(Abbildung 15) gezeigt werden konnte, entspricht die Eingangssequenz von 
„Istanbul Total“ zu Beginn formal gesehen eher einem Reisevideo als einer 
Late-Night-Show. Erst im späteren Verlauf nähert sich die Sendung wieder 
dem gattungsspezifischen Montagegestus von Late-Night-Shows an. So wird 
im Falle von „Istanbul Total“ das anfängliche Spannungsverhältnis zwischen 
der Fokussierung des Moderators und der Fokussierung der Stadt Istanbul 
letztlich zugunsten der Fokussierung des Moderators gelöst. Der vorgegebene 
Anspruch von „Istanbul Total“ ist dem Produktionsformat der Sendung un- 
tergeordnet. Die Stadt Istanbul ist nichts weiter als eine Kulisse, vor der der 
Moderator steht. Dieser Hintergrund ist mit dem großen Fernsehbildschirm in 
„IV Total“ (Abbildung 17) oder der gemalten Abendskyline der Harald- 
Schmidt-Show (Abbildung 13) vergleichbar. Wie die Einstellungsvariation 
von „Istanbul Total“ (Abbildung 20) ergibt, ist die Kameraperspektive der 
Sendung flach, die Farben der türkischen Kulisse sind hellblau-blass-kühl 
verwaschen. Der Moderator steht planimetrisch in deutlichem Farbkontrast 
zu seiner Umgebung und ist auch durch seine klar umrissene Formgebung 
von ihr abgegrenzt. Insgesamt dokumentiert sich in diesen Aspekten eine 
deutliche Opposition zur Stadt Istanbul. Demgegenüber befindet sich der 
Sprecher des Reisevideos „Reiselust Istanbul“ (Abbildung 15) direkt in der 
Stadt; formal gesehen aus dem Zentrum genommen und in der linken Bild- 
hälfte platziert, sodass die Stadt im perspektivischen Zentrum der Einstellun- 
gen aufscheinen kann. Istanbul kommt im Falle des Reisevideos auch auf der 
Textebene stärker zur Sprache, indem der einheimische Erzähler der Sequenz 
auf Türkisch zu sprechen beginnt. Zusammenfassend dokumentiert sich in 
der Eingangspassage von „Istanbul Total“ eine eindeutige Distanzierung der 
Moderatorperson von seiner Umgebung. Stefan Raab ist in Istanbul und zu- 
gleich doch nicht dort. Es handelt sich sozusagen um einen Besuch aus siche- 
rer Distanz, wie er dem deutschen Late-Night-Show-Publikum zumutbar ist. 


Auf der Ebene der planimetrischen Komposition konnte die zentrale symmet- 
rische Bildposition des Moderators in der Sendung „Istanbul Total“ (Abbil- 
dung 20, 0 sec. und 79 sec.) als typisches Element von Late-Night-Shows 
identifiziert werden, das seine kulturhistorische Verankerung in christlich- 
hegemonialen Bildtraditionen findet. Zur Geltendmachung und Behauptung 
ihrer zentralen Bildstellung sind Moderatoren generell auf eine mit den ab- 
bildenden Bildproduzent/inn/en akkordierte Einstellungs- und Montageleis- 
tung angewiesen. Dieses Zusammenspiel kann als allgemeines Merkmal 
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massenproduzierter Fernsehsendungen betrachtet werden. Die Vorauspla- 
nung und Berechenbarkeit — auch von ,,spontanem“ Moderatorverhalten - ist 
eine unvermeidliche Konsequenz, die sich aus den sich regelmäßig wieder- 
holenden Produktionsabläufen sowie dem Ökonomisierungsdruck dieser 
Sendungen ergibt. Bohnsack (2009, S. 240) bezeichnet die Kollusion von 
abbildendenden und abgebildeten Bildproduzent/inn/en als „Monostrukturie- 
rung durch den Showmaster“. 

Im Rahmen der Gesten- bzw. Gebärdenvariation konnte schließlich an- 
hand einer besonders auffälligen Gebärde (Abbildung 26), des „Jackeaufma- 
chens“ sowie der (Ver-)Kleidung des Moderators, die Übergegensätzlichkeit 
zwischen hegemonialer Moderatorstellung und Distanzierung gegenüber der 
Umgebung genauer herausgearbeitet werden. Im Gewand eines Sultans (d.h. 
eines ehemaligen osmanischen Herrschers) nimmt der Moderator die Pose 
eines Schwarzmarkthändlers ein. Dass er auf die leere Mantelinnenseite zeigt, 
macht klar, dass wir es hier mit einer Als-ob-Handlung zu tun haben müssen 
— einer Handlung, die der Moderator außerhalb seiner Verkleidung nicht 
ausführen würde. Damit entpuppt sich die gespielte Handlung selbst als Ver- 
kleidung, wodurch ihr denotativer Kern zum Thema wird: Wie bei einem 
Theaterstück verweist das in der Verkleidung Gespielte stets zurück auf die 
in der Verkleidung eingenommene Rolle sowie die umgebende Kulisse. 
Nicht der Moderator entlarvt sich somit durch die Geste als Schwarzhändler. 
Vielmehr wird all das, worauf die Verkleidung verweist, mit Schwarzhandel 
in Verbindung gebracht: die Einwohner und einstigen Herrscher der Stadt 
Istanbul und der Türkei. Im Sinne einer Übergegensätzlichkeit relativiert die 
komische Verkleidung einerseits die stereotype Deutung der Handlung durch 
humoristische Brechung. Andererseits ermöglicht der Modus des Komischen 
aber erst das unproblematische Einschleusen stereotyper semantischer Viren. 
Als reine Überbringer von Botschaften getarnt, können sich Sendung und 
Moderator jeglicher inhaltlicher Kritik entziehen. In Hinblick auf die Gat- 
tungsanalyse von Late-Night-Shows kann der Modus der Verkleidung und 
Distanzierung somit als ein praktikables und effektives Instrument angesehen 
werden, womit sich dieser Sendungstyp gegen eindeutige Zuschreibungen 
und Vorwürfe immunisieren kann, was ihn weniger angreifbar macht. 
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Abbildung 28 : Stefan Raab präsentiert die Beyaz-Show in TV Total, 1. Dez. 
2005 


Im Dezember 2005 lädt Stefan Raab den in der Türkei populären Moderator 
Beyaz in seine TV-Show nach Deutschland ein. Die Möglichkeit dieses Be- 
suchs wurde eineinhalb Jahre zuvor durch „Istanbul Total“ geschaffen. Im 
Rahmen dieser Sendung war Raab damals in der türkischen Beyaz-Show 
aufgetreten. Die wechselseitigen Fernsehauftritte von Raab und Beyaz wur- 
den medial als Zeichen der Völkerverständigung beworben. Der Haupteffekt 
der Einbindung des türkischen Beyaz in Raabs Sendung dürfte jedoch in 
beiden Fällen (sowohl 2004 als auch 2005) vor allem die Generierung von 
Content und Quote für die beteiligten TV-Shows gewesen sein. 
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6 „Istanbul Total“: Die Beyaz-Show 


Bei der Interpretation der Eingangspassage des ersten Sendetags von „Istan- 
bul Total“ ging es mir im vorhergehenden Kapitel insbesondere um die Sen- 
sibilisierung für praktische Interpretationsansätze in der Bilddimension. In 
weiterer Folge möchte ich mich nun stärker an jenen Arbeitsschritten orien- 
tieren, die Bohnsack (2009) als allgemeine Ansätze für die Film- und Vi- 
deointerpretation vorgestellt hat. Eine besondere Rolle spielen dabei zum 
einen die Interpretation auffälliger Verhaltensmuster seitens der abgebildeten 
Bildproduzent/inn/en sowie zum anderen die Interpretation des Sprechtextes 
in Relation zur Bilddimension. 


6.1 Auswahl der Passage 


Nachdem der Showmoderator Stefan Raab am ersten Sendetag von „Istanbul 
Total“ vom Balkon aus sein Publikum mit der türkischen Studioumgebung 
am Bosporus vertraut gemacht hat, wagt er sich am zweiten Sendetag in das 
fremde Produktionsstudio einer türkischen Fernsehshow. Der nun folgende 
Vergleich der Beyaz-Show mit der Sendung ‚Istanbul Total“ liefert zusätzli- 
che Aufschlüsse hinsichtlich der zuvor in Kapitel 5 anhand der Eingangspas- 
sage (erster Sendetag) herausgearbeiteten „Distanzierung von der türkischen 
Umgebung“, der Mechanismen der „Stereotypisierung“ und „Nostrifizie- 
rung“ sowie der „Einheit von abgebildeten und abbildenden Bildprodu- 
zent/inn/en“. Letztere ist im Falle der Beyaz-Show am zweiten Sendetag von 
„Istanbul Total“ in doppelter Weise vollzogen, da es sich bei der türkischen 
Beyaz-Show praktisch um eine „Show in der Show“ handelt. Die Beyaz- 
Show wurde vor ihrer Ausstrahlung im Rahmen von „Istanbul Total“ im 
deutschen Fernsehen nochmals einer Postproduktion unterzogen, wodurch 
diese Sequenz eine starke Fokussierung erfahren hat. In der knapp zwei- 
minütigen Passage der Beyaz-Show sind anfangs der deutschstämmige 
Show-Moderator Stefan Raab und später auch sein musikalischer Protegé 
Max als abgebildete Bildproduzenten in einer fremden, türkischstämmigen 
Produktionsumgebung beobachtbar. Von hohem Interesse für die Interpreta- 
tion ist dabei der Umgang Stefan Raabs mit Unsicherheit und Unbeholfen- 
heit. Diese treten sowohl auf der Bild- als auch auf der Textebene in deutli- 
chem Maße zutage. Im Gegensatz zu „Istanbul Total“ sind Stefan Raab als 
Gast einer fremden Show die Möglichkeiten entzogen, die abbildenden Bild- 
produzent/inn/en (Kameramänner/-frauen, Regisseur/innen etc.) auf direktem 
Wege live zu dirigieren. Jedoch stellt das Instrument der Postproduktion ein 
Mittel dar, um die bereits aufgenommene Beyaz-Show im Nachhinein zu 
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modifizieren und im Kontext der eigenen Show „Istanbul Total“ zu rekon- 
textualisieren. 


6.2 Videotranskript 


Abbildung 29: Beyaz-Show 


Passage (oder Sequenz): | „Auftritt in der Beyaz-Show“ 

Film (oder Video): http://tvtotal.prosieben.de/tvtotal/videos/player/?contentlId=14157 
Datum: 11. Mai 2004 

Time Code (min.): 03:53-05:43 

Dauer: 1:50 min. 

Transkription: Stefan Hampl 

Korrektur: - 


Signation der Ber az-Show (Melodie von „Anton aus Tirol“ mit türkischem Text 
Klatschen und Pfiffe 


3 T| A 
ler Beyaz-Show (Melodie von „Anton aus Tirol“ mit türkischem Text 
Klatschen und Pfiffe 
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a — = = 
| Locker, locker. Veen Dank, danke , schôn an a 
Brüllen, Klatschen und Pfiffe 


www O = 


| Am: |Hallo, mein Name ist Stefan Raab, ich komme aus Deutschland. Und jetzt, ah 
Gerduschf EC Gelachter 


n es ——— ~ 
inam pee pee Pe we = 
| Am: | | ja | undjetzt kommt euer Gastgeber. 
(Music|. ———-_- |] of ef ef Ee 
Gelachter eee eee IM] 


| CS 
[Musik:| [Signation der Beyaz-Show (Melodie von „Anton aus Tirol" mit türkischem Text 
| Gebrüll | Gebrüll und Pfiffe 


|Musik:| Signation der Beyaz-Show (Melodie von „Anton aus Tirol“ mit türkischem Text 
[Geräusch] Gebrüll und Pfiffe Klatschen 


|Musik:| Signation der Beyaz-Show (Melodie von „Anton aus Tirol“ mit türkischem Text 
(Geräusch! Klatschen 
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er = 

[ Bm: | Spricht türkisch] BEE a e] 

| Ccm: | S S Wir könnten natürlich jetzt das übersetzen, 
| | Er BE 


Musik! [N 
(Geräusch! Klatschen fee 


i 
aw 


Der Chef hat ja auch nichts verstanden|Zum Glück gibt es aber eines, was alle verstehen 


can’t wait until toni=ight, 
Rhythmisches Klatschen 


ya Aba Stefan Raab wäre nicht 
have u leiser side, ba=ab 
a Klatschen 
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a ee ee ee ee 
| Cm: |Stefan Raab, wenn er sich nicht noch was Besonderes ausgedacht hatte.|__[Und so haben Stefan und Max 
leise Just can’t wait until toni=ight bab 


er selbes Lied auf Türkisch gesungen 
natürlich noch eine Überraschung mitgebracht 
lauter] selbes Lied auf Türkisch gesunge: 
Rhythmisches Klatschen 


Lied auf Türkisch gesungen 
Rhythmisches Klatschen 


Lied auf Türkisch ¢ gesungen 
Lied auf Türkisch gesungen 
Rhythmisches Klatschen 


Am: Lied Fi m gesungen 
DEA etre more time 


| Liedauf Türkischgesungen č |] 
Rhythmisches Klatschen 
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oo | O | | Damit haben wir die Türken wohl 


isch und Pi 


ndgültig auf unserer Seite. | Danke, Beyaz! | | 


| 
Schlussakkorde 
Klatschen, Brüllen und Pfiffe 


6.3 Interpretation in der Bilddimension 


Wird die Gesamtinterpretation eines Videos oder Films sowohl hinsichtlich 
der Bild- als auch der Textdimension angestrebt, so empfiehlt Bohnsack 
(2009, S. 195), aus methodologischen Gründen bei der Interpretation der 
Bilder zu beginnen. Dadurch ist der/die Forschende von vornherein dazu 
aufgefordert, sich auf die eigensinnige „Sprache“ der Bilder „einen Reim zu 
machen“, bevor er/sie diese mit den Interpretationen der Sprechtexte ver- 
gleicht. Die so im Vergleich von Bild- und Textdimension zutage tretenden 
Homologien und Kontraste wären bei einem umgekehrten Prozedere weit 
weniger ausgeprägt. Dies hat laut Bohnsack (2009) mit dem Erfordernis der 
grundlegenden Unterscheidung von „sehendem“ und „wiedererkennendem 
Sehen“ (Imdahl, 1996) im Rahmen der Bild- und Videointerpretation zu tun. 
Bereits vorliegende Ergebnisse der Textinterpretation eines Videos bzw. 
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Films vertiefen eher das „wiedererkennende Sehen“, indem sie zum Auffin- 
den der rekonstruierten Konzepte im Bild einladen. Dabei tritt laut Bohnsack 
(2009) erschwerend hinzu, dass das Medium Text tendenziell eher eine se- 
quenzielle und das Medium Bild eher eine simultane Struktur aufweist. Die 
Besonderheit der Bildstruktur ist es, Gegensätze im Sinne sogenannter 
„Übergegensätzlichkeiten“ (Imdahl, 1996) zugleich aufwerfen und auflösen 
zu können. Diese Fähigkeit ist letztlich als grundlegendes Alleinstellungs- 
merkmal von Bildern anzusehen, selbst wenn Film- bzw. Videobilder — in 
Abgrenzung zu Standbildern — ebenso einer sequenziellen Struktur folgen 
wie der Text. 


6.3.1 Formulierende Interpretation: Sequenzen, 
Einstellungswechsel und Montage 


Anhand des Fallmaterials von „Istanbul Total“ hat Bohnsack (2009, S. 198) 
ein Schema entwickelt, nach dem sich die Sequenzen von Fernsehshows und 
auch einige andere Film- bzw. Videogattungen in ihrer hierarchischen Ord- 
nung verstehen lassen. Prinzipiell lassen sich drei Gruppen von Sequenzen 
unterscheiden: Hauptsequenzen (HS), Untersequenzen (US) und eingelagerte 
Sequenzen (ES). 

Die gesamte Dauer der Fernsehshow „Istanbul Total“ beträgt pro Sende- 
tag zirka 35 Minuten. Am zweiten Sendetag wurde eine Passage der Beyaz- 
Show ausgewählt, die insgesamt 1 Minute und 51 Sekunden dauert. Die Sze- 
ne zeigt die Studiobühne der Beyaz-Show, bestehend aus Showtreppe, Podi- 
um mit Schreibtisch, rotem Sessel und beiger Couch. Links im Hintergrund 
ist durch Fensterrahmen eine Stadt bei Nacht zu sehen. Rechts im Hinter- 
grund sitzt eine fünfköpfige Gruppe von Musikern. 

Innerhalb der vorliegenden Passage lassen sich 2 Hauptsequenzen (HS) 
identifizieren: 


e Hauptsequenz I: 3:53-4:52 (60 Sekunden) 

„Stefan Raab, Beyaz und Assistentin kommen auf die Bühne“ 
e Hauptsequenz II: 4:53-5:43 (51 Sekunden) 

„Stefan Raab und Max singen auf der Bühne“ 


Hauptsequenz I (HS 1) ist die umfangreichste Sequenz. Sie wird in unter- 
schiedlichen Einstellungsgrößen und mit unterschiedlichen Personen in fol- 
genden Untersequenzen (US) realisiert. Der Einstieg erfolgt über einen Es- 
tablishing Shot” (Halbtotale): 


59 „meist in der Totale oder Halbtotale durchgedrehte Einstellung, die beim Schnitt als Grund- 
lage für eine Szene genommen werden kann“ (Monaco 2003, S. 103) 
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US 1: Stefan Raab alleine auf der Bühne (Halbtotale): 3:53-3:54; 
3:59-4:25 (28%) 

US 2: Stefan Raab (amerikanische Einstellung): 3:55-3:58 

US 3: Beyaz (amerikanischer Einstellung): 4:26-4:30 

US 4: Stefan Raab und Beyaz auf der Bühne (Zoom Totale zu Halb- 
totale): 4:31-4:35 (5°) 

US 5: Stefan Raab, Beyaz und Assistentin auf der Bühne (Zoom 
Halbtotale zu Totale): 4:36-4:50 (15“) 


In die Hauptsequenz I sind folgende Sequenzen eingelagert (ES): 


ES 1: Publikum (Totale): 4:06-4:07, 4:51-4:52 (in Summe: 4“) 


Hauptsequenz II ist beinahe genauso lang wie HS I. Sie wird in unter- 
schiedlichen Einstellungsgrößen und mit unterschiedlichen Personen in fol- 
genden Untersequenzen (US) realisiert. Der Einstieg erfolgt über einen Es- 
tablishing Shot (Halbtotale). Naheinstellungen sind jeweils Ausschnitte der 
Halbtotale: 


US 6: Stefan Raab, Beyaz, Frau und Max auf der Bühne (Halbto- 
tale): 4:53-5:02, 5:13-5:24, 5:29-5:33, 5:40-5:43 (36%) 

US 7: Stefan Raab und Max schräg im Profil (Amerikanische): 
5:03-5:07 

US 8: Stefan Raabs Gesicht (Close-up): 5:10-5:12 


In die Hauptsequenz II sind folgende Sequenzen eingelagert (ES): 


ES 1: Publikum (Halbtotale): 5:08-5:09, 5:25-5:28, 5:33-5:39 (in 
Summe: 12“) 


Hauptsequenz I: 3:53-4:52 (60°) 
„Stefan Raab, Beyaz und Assistentin kommen auf die Bühne“ 


Übergang Se- In Out Einstellung Standort/Bewegung Thema 
quenz 
US 1 3:53 | 3:54 Halbtotale Fahrt nach rechts; | Stefan 
Schwenk nach links Raab auf 
der Bühne 
Schnitt 
US2 3:55 | 3:58 Amerikani- folgt Stefan Raab | Stefan 
sche nach links Raab 
Schnitt 
US 1 3:59 | 4:05 Halbtotale schneller Zoom aus | Stefan 
der Totalen in die | Raab auf 
Halbtotale und kurz | der Bühne 
zurück; Fahrt nach 
links, Schwenk 
nach rechts 
Schnitt 


ES 1 4:06 | 4:07 Halbtotale Fahrt nach links Publikum 
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Schnitt 


US 1 4:07 | 4:25 Halbtotale Fahrt nach unten; | Stefan 
nach links; Zoom in; | Raab auf 
Zoom out der Bühne 
Schnitt 
US3 4:26 | 4:30 Amerikani- folgt Beyaz nach | Beyaz 
sche links 
Schnitt 
US 4 4:31 4:35 Totale Zoom in; Fahrt nach | Stefan 
links und Schwenk | Raab und 
nach rechts; Beyaz auf 
der Buhne 
US 5 4:36 | 4:50 Halbtotale Zoom out auf | Stefan 
Totale; Fahrt nach | Raab, 
rechts und Schwenk | Beyaz und 
nach links; Zoom in | Assisten- 
auf Halbtotale tin auf der 
Bühne 
Schnitt 
ES 1 4:51 4:52 Halbtotale Handkamera Publikum 
Schnitt 
Hauptsequenz IT: 4:53-5:43 (51°) 
„Stefan Raab und Max singen auf der Bühne“ 
Übergang Sequenz In Out Einstellung Standort/Bewegung | Thema 
US6 4:53 | 5:02 Halbtotale Fahrt nach rechts | Stefan 
und Schwenk nach | Raab, 
links; leichter Zoom | Beyaz, 
in; leichter Zoom | Assistentin 
out und Max 
auf der 
Bühne 
Überblendung 
1“ 
US 7 5:03 | 5:07 | Amerikanische | Drehen aus rechter | Stefan 
Schräglage in die | Raab und 
Horizontale Max 
schräg im 
Profil 
Schnitt 
ES 1 5:08 | 5:09 Halbtotale leichter Schwenk | Publikum 
nach links unten 
Schnitt 
US 8 5:10 | 5:12 Close-up unbewegt Stefan 
Raabs 
Gesicht 
Überblendung 
1“ 
US 6 5:13 | 5:24 Halbtotale Fahrt nach rechts; | Stefan 
Zoom out; leichte | Raab, 
Wackler am Ende Beyaz, 
Assistentin 
und Max 
auf der 
Bühne 
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Schnitt 


ES 1 5:25 | 5:28 Halbtotale Handkamera Publikum 
Schnitt 
US6 5:29 | 5:32 Halbtotale Fahrt nach links; | Stefan 
Zoom out Raab, 
Beyaz, 
Assistentin 
und Max 
auf der 
Bühne 
Schnitt 
ES 1 5:33 | 5:39 Halbtotale Handkamera Publikum 
Schnitt 
US6 5:40 | 5:43 Halbtotale Zoom in; Fahrt | Stefan 
nach links und | Raab, 
Schwenk nach | Beyaz, 
rechts Assistentin 
und Max 
auf der 
Bühne 


6.3.2 Auswahl der Fotogramme 


Laut Bohnsack (2009, S. 201) gilt als Auswahlkriterium geeigneter Foto- 
gramme für die detaillierte Einzelbildinterpretation, „dass diese Fotogramme 
zumindest die umfangreichsten Hauptsequenzen (HS) in deren umfang- 
reichsten Einstellungsvarianten, also in den Untersequenzen (US), repräsen- 
tieren sollten“. Auf der Basis dieser Überlegungen wurden folgende drei 
Fotogramme für die weiterführende Interpretation ausgewählt: 


Erstes Fotogramm: US 1 „Stefan Raab auf der Bühne“ (4:08) 


Ist der umfangreichsten Untersequenz (US 1) entnommen und eignet sich gut 
für die komparative Analyse mit der Studiosequenz der Eingangspassage von 
„Istanbul Total“ (Abbildung 30). 
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Abbildung 30: Das ,,AuBenstudio“ von „Istanbul Total“ 
Zweites Fotogramm: US 5 „Beyaz, Assistentin und Raab“ (zweitumfang- 
reichste Sequenz) (4:45) 


Drittes Fotogramm: HS 2, US 6 „Songcontest Song“ (absolut umfang- 
reichste Sequenz) (5:21) 


6.3.3 Erstes Fotogramm: Stefan Raab auf der Bühne 


a) Formulierende Interpretation 


vu 


Vali 
[=t | 


Abbildung 31: Stefan Raab in der Beyaz-Show (4:08) 
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Vorikonografische Interpretation 


Nach den Titeleinblendungen einer Abendshow kommt ein Mann über die 
Treppe im Bildhintergrund auf die Bühne. Er bleibt an der Vorderkante eines 
Podests im Bildmittelgrund stehen. Der Körper des Mannes befindet sich in 
der Bildmitte, ist zur Gänze erkennbar und den Zuschauer/inne/n frontal 
zugewandt. Seine beiden Arme liegen am Körper an, die Unterarme sind 
symmetrisch im 45°-Winkel nach unten abgespreizt. Die beiden Handflächen 
sind zum Boden flach ausgestreckt einander zugewandt. Für die Bildbe- 
trachter/innen sind die leicht nach oben erhobenen Handrücken erkennbar. 
Der Kopf des Mannes ist leicht nach links gekippt. Sein Gesichtsausdruck ist 
aufgrund der niedrigen Bildauflösung uneindeutig. 

Das Bühnenpodest hat eine helle, glatte Holzoberfläche und wird vorne 
von einer sanften Krümmung abgeschlossen. Es ist zirka 25 cm hoch und an 
der Vorderseite weiß lackiert oder von innen beleuchtet. Auf dem Podest 
befinden sich links ein kleiner, brauner Schreibtisch, neben dem rechts ein 
roter Sessel steht. Auf der gegenüberliegenden rechten Seite des Podests 
befindet sich eine beige Couch. Alle drei Möbel sind den Betrachter/inne/n 
schräg zugewandt, sodass jeweils jene Seite weiter hinten ist, die sich näher 
an der Bildmitte befindet. Die Vorderseite des Schreibtischs hat an der Un- 
terkannte drei abwärtsgekrümmte Halbbögen. Auf der Schreibtischplatte 
befinden sich verschiedene kleinere Gegenstände. Auf dem roten Ledersessel 
daneben ist eine Gitarre in aufrechter Position erkennbar. Sowohl Sessel als 
auch Gitarre werden vom Mann auf der Bühne teilweise verdeckt. 

Unterhalb des Podests sind im Bildvordergrund zirka ein Dutzend Köpfe 
von hinten zu sehen. Jeweils in Kopfhöhe sind zusätzlich einige erhobene 
Hände erkennbar. Der Bildhintergrund setzt sich mit einer ca. 35 cm hohen 
Stufe schräg unterhalb der Bildhälfte vom Rest des Bildes ab. Die Stufe ver- 
läuft links und rechts des Podests im Mittelgrund und ist weiß. Unterhalb 
ihrer Mitte ist ein schmaler, blauer Längsstreifen sichtbar. Auf der Oberseite 
der Stufe ist ein dunkelbrauner Fußboden zu erkennen, der bis zur Rückwand 
verläuft. Auf der linken Seite ist die Rückwand gelb-orange bemalt. Auf ihr 
sind zwei quadratische, dunkelbraune Holzrahmen zu sehen, in denen grau- 
weiße Punkte und Linien erkennbar sind. An der Unterseite der Rahmen sind 
jeweils zwei grüne Blumenkistchen befestigt. Zwischen den Rahmen, an 
deren Oberkante, ist ein kleiner, brauner Punkt zu sehen; genau in der Mitte 
steht ein Objekt, das an eine stilisierte Katzenfigur mit langem Hals erinnert. 
Auf der rechten Seite ist die Rückwand in Violetttönen gehalten. Sie ist ver- 
tikal abwechselnd durch weiße und violette Streifen, Quadrate und Sterne 
strukturiert. Vor der Rückwand sind vier rot gekleidete Personen erkennbar. 
Die linken drei sind den Betrachter/inne/n zugewandt. Vor ihnen sind auf 
Hüfthöhe graue Tafeln angebracht. Die Person an der rechten Bildkante ist 
im Profil zu erkennen. Sie ist bis zur Hüfte von einer rechteckigen, schwar- 
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zen Fläche verdeckt, die an der Oberkante durch eine graue Fläche abge- 
schlossen ist. Zwischen den beiden Rückwänden ist ein weißer Türrahmen 
erkennbar, an dessen Unterseite eine weiße Treppe zu sehen ist. Durch den 
Türrahmen ist schemenhaft eine violett-weiße Fläche erkennbar. 


Ikonografische Interpretation 


Der deutsche Showmoderator Stefan Raab befindet sich im Studio der türki- 
schen Beyaz-Show. Das Studio ist nach dem Vorbild typischer Late-Night- 
Shows eingerichtet. Die Rahmen auf der linken Seite stellen Fensterattrappen 
dar, die den Blick auf das nächtliche Istanbul vortäuschen. Der weiße Tür- 
rahmen ist der Bühneneingang mit Showtreppe. Die vier Personen im rechten 
Bildhintergrund stellen die Studioband dar. Bei den Köpfen im Bildvorder- 
grund handelt es sich um das sitzende Studiopublikum. 


b) Reflektierende Interpretation 


Planimetrische Komposition 


Abbildung 32: Planimetrie 


Planimetrisch ist das Bild durch ein Gitter von kleinen und großen Quadra- 
ten, Rechtecken und Linien in fünf Bereiche zerteilt: Das linke und rechte 
obere Bildviertel, dazwischen der weiße Bühneneingang, darunter die freie 
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Bodenfläche mit Podest sowie der Publikumsbereich. Durch seine zentrale 
Positionierung im Bild verbindet die Person Stefan Raab alle diese Bereiche, 
mit Ausnahme des Publikumsbereichs. Wie durch die eingezeichnete Linie 
erkennbar, ist dieser vom Rest des Bildes horizontal klar abgesetzt. 


Perspektivische Projektion 


Abbildung 33: Perspektivische Projektion 


Als perspektivische Anhaltspunkte im Bild dienen die parallelen, horizonta- 
len Linien der Fensterrahmen im Bildhintergrund. Sie verweisen auf eine 
Frontalperspektive. Da sich die vertikalen Linien nach unten hin verjüngen, 
ist von einer leicht abwärtsgeneigten Kamera — und damit von einem zentra- 
len Fluchtpunkt in der oberen Bildhälfte — auszugehen. Er dürfte sich auf der 
Horizontlinie in etwa zwischen Brust und Bauch von Stefan Raab befinden. 


Szenische Choreografie 


Auf der Ebene der szenischen Choreografie sind drei Personenkreise zu er- 
kennen, die in bestimmter Weise aufeinander bezogen sind. Stefan Raab steht 
in der Bühnenmitte frontal einer im Bildvordergrund sitzenden Menschen- 
gruppe sowie den Bildbetrachter/inne/n gegenüber (beides Publikum). Eben- 
so frontal zugewandt ist die Gruppe von Musikern, die im Hintergrund des 
rechten, oberen Bildviertels zu sehen ist. Die Musiker scheinen für die Men- 
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schen im Vordergrund zu spielen, die mit ihnen händeklatschend in Verbin- 
dung stehen. Die Geste Stefan Raabs, der mit dem Publikum im Mittelgrund 
im Blickkontakt steht, ist beschwichtigend. 


Ikonologische bzw. Ikonische Interpretation 


Das Fotogramm eignet sich zur komparativen Analyse mit den Studioauf- 
nahmen der Eingangspassage von „Istanbul Total“ (Abbildung 30). Auf der 
Ebene der formalen Struktur des Bildes dokumentieren sich zunächst fol- 
gende zwei Gemeinsamkeiten zwischen den Fotogrammen: In beiden Fällen 
ist eine Trennung und Distanzierung erkennbar, die sich zwischen Bühnen- 
podest und Publikum manifestiert, welches planimetrisch vom Rest des Bil- 
des abgetrennt ist, in szenischer Hinsicht sind sie in der Beyaz-Show sowohl 
Stefan Raab als auch den Musikern im Hintergrund oppositionell zugewandt. 
Weiters ist auch im vorliegenden Fotogramm von einer mehrfachen Zentrie- 
rung der Person auszugehen. In planimetrischer Hinsicht repräsentiert Stefan 
Raab eine Übergegensätzlichkeit. Durch seine räumliche Positionierung ent- 
steht eine Synthese der oberen Bildbereiche. Gleichzeitig wird durch seine 
Position an der Podestkante, durch den deutlichen Farbkontrast zwischen 
Hemd und Hose sowie die flache Handhaltung die räumliche Trennung zum 
Publikum verstärkt. Auf der Ebene der szenischen Choreografie wird dieser 
Befund durch die frontale Gegenposition gestützt, die die abgebildeten Bild- 
produzenten Raab und Publikum einnehmen. Sowohl im Klatschen des Pub- 
likums als auch in der abwiegelnden Gestikulation von Raabs Händen doku- 
mentiert sich eine gegenseitige Bezogenheit im Modus der Distanzierung. 
Raab wirkt abwartend befremdet. Der türkische Bühnenkontext scheint ihm 
nicht ganz geheuer. 

So dokumentiert sich im Falle Stefan Raabs eine große Unsicherheit so- 
wie ein „Kontrollverlust, der nicht eigentlich komisch ist“ (Bohnsack, 2009, 
S. 222). Er manifestiert sich in der „beruhigenden Gestik“, in der psychischen 
Distanz zum Publikum durch Verbleib am Podium, sowie — wie die Zeitlu- 
penanalyse (s.u.) erweist — im mehrfachen Umdrehen zum Bühneneingang. 
In dieser letzten Geste dokumentiert sich Raabs Bemühung, mittels Blick- 
kontakt den Beistand des Showmasters Beyaz herbeizurufen, der aber nicht 
erscheint. Dass Raab auf die Unterstützung Beyaz‘ hofft, zeigt sich darin, 
dass er — nach dreimaligem Umdrehen — verbal seinen Auftritt in der Show 
ankündigt. 
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Einschub: Zeitlupenanalyse 


Detailinterpretation einer fokussierten Geste — Das mehrmalige Umdrehen 
Stefan Raabs 


Stefan Raab dreht sich während seines Auftritts dreimal deutlich nach hinten 
zum Bühneneingang um. Die Körperdrehungen dauern jeweils etwa zehn 
Sekunden. Im Folgenden sind die Fotogramme der Bewegungsabläufe darge- 
stellt. Raabs Bühnenauftritt beginnt in Abbildung 34 mit der Geste des soge- 
nannten „Beyaz-Moves“ (s. u.). Danach erfolgt die (unwillkürliche) Gebärde 
der ersten Blickwendung. 


Abbildung 35: Beyaz-Show (4:04-4:05), 4 Bilder pro Sekunde 
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Abbildung 36: Beyaz-Show (4:09-4:10), 4 Bilder pro Sekunde 


Im Vergleich zu den Erkenntnissen zur Eingangspassage werden daneben 
folgende Kontraste deutlich: Aus planimetrischer Sicht ist das vorliegende 
Fotogramm von oben bis unten klar und detailliert strukturiert. Es gibt keine 
diffusen Bereiche wie beispielsweise in der mit Plüschpolstern und orientali- 
schen Teppichen ausgestatteten Sitzecke des „Istanbul Total“-Studios 
(Bohnsack, 2009, S. 210). Die klare Struktur wird auch durch die Zentralper- 
spektive unterstützt, die dem Bild einen symmetrischen Aufbau verleiht. Im 
Gegensatz zur Eingangspassage von „Istanbul Total“ (Kap. 5) findet sich 
weiters keine formale Distanzierung zwischen Innen- und Außenwelt 
(Bohnsack, 2009, S. 210) — auf ein Außen wird bestenfalls durch die beiden 
stilisierten Fenster verwiesen. Dieses Außen ist aber nicht eindeutig identifi- 
zierbar, sondern lediglich erahnbar. In der Gattung der Late-Night-Shows 
handelt es sich in der Regel um eine Nachtaufnahme der Stadt“, aus der die 
Sendung stammt. Das Außen ist hier folglich nur Schablone. 

In Bohnsacks (2009, S. 208) Bildinterpretation der Sitzecke im „Istanbul- 
Total“-Studio dominiert ein opakes und diffuses Bild der Türkei. In kompa- 
rativer Analyse mit dem Studio der Beyaz-Show ergibt sich eine deutliche 
Validierung dieser Annahme. Das Bild wirkt hier ausgewogener und ruhiger. 
Es ist klar strukturiert und aufgeräumt. Sämtliche Dinge sind an ihrem Platz 
und funktional zugeordnet: der Schreibtisch des Moderators, die Couch für 
die Gäste, die Ecke für die Musiker etc. Auffallend ist außerdem, dass das 
Podium, auf dem sich das Handlungsgeschehen abspielt, dem Publikum di- 
rekt zugewandt ist. Dies ist ein Kontrast zum „Istanbul-Total“-Studio, wo die 
„orientalische Sitzecke“ ja seitlich angeordnet und sogar noch durch eine Bar 
vom Publikum getrennt ist. Im „Istanbul-Total“-Studio sprechen der Mode- 


60 Eine Nachaufnahme gibt es auch bei der Harald-Schmidt-Show (vgl. Kap. 5) 
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rator und seine Gäste in der Sitzecke nur direkt in die Kamera, im Studio der 
Beyaz-Show zur Kamera und zum Publikum. Es gibt hier keine versteckten, 
dem Publikum abgewandten Räume. In der größeren Offenheit dieser Kons- 
tellation dokumentiert sich auch eine geringere Exklusivität der Podiums- 
plätze als im Studio von „Istanbul Total“. 


6.3.4 Zweites Fotogramm: Beyaz, Assistentin und Stefan Raab 


Beim Vergleich zwischen dem ersten (Abbildung 31) und dem zweiten Foto- 
gramm der Beyaz-Show (Abbildung 37) beschränken sich die Beschreibun- 
gen und Interpretationen im Sinne der Forschungsökonomie auf die Verände- 
rungen des Bildes. 


a) Formulierende Interpretation 


Abbildung 37: Beyaz, Assistentin und Stefan Raab (4:45) 


Vorikonografische Interpretation 


Der Bildausschnitt hat sich im zweiten Fotogramm auf die Halbtotale verengt 
und nach links verschoben. Nach wie vor sichtbar sind die beiden stilisierten 
Fensterrahmen im Hintergrund sowie die Treppe dort. Von den Personen 
rechts im Bild ist nur noch die äußerst linke erkennbar. Es handelt sich um 
einen Mann mit schwarzen Haaren, dessen Kopf und Oberkörper nach rechts 
gewandt sind. Die Personen am unteren Bildrand sind fast zur Gänze ver- 
schwunden — fünf Kopfrundungen sind noch zu erkennen. Das Podium, der 
darauf befindliche Schreibtisch, der rote Sessel sowie die Couch werden von 
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drei Personen im Bildvordergrund verdeckt. Die Füße der Personen sind 
abgeschnitten. Bei der linken Person handelt es sich um einen Mann mit 
kurzen, schwarzen Haaren. Sein Kopf sowie sein rechtes Bein sind den Bild- 
betrachter/inne/n frontal zugewandt. Der Mund ist leicht geöffnet. Der Mann 
trägt einen beigen Herrenanzug mit weißem Hemd und einer Krawatte mit 
breiten, braunen Schrägstreifen. Das Sakko ist geöffnet und fällt aufgrund der 
Körperhaltung des Mannes auseinander, sodass ein brauner Gürtel gut er- 
kennbar ist. Seine rechte Hand hat der Mann auf Schulterhöhe nach vorne 
erhoben und geöffnet, der Daumen weist nach oben. Sein rechtes Bein ist in 
Richtung Bildmitte gedreht, die linke Hand ruht auf der Schulter einer zwei- 
ten Person in der Bildmitte. Diese Person ist zirka einen ganzen Kopf kleiner 
als die erste. Es handelt sich um eine zierliche Frau, deren Körper den Bild- 
betrachter/inne/n frontal zugewandt ist. Ihre Beine und Schultern sind paral- 
lel, die Arme fallen links und rechts gerade herab. Die Frau trägt eine 
schwarze Hose und eine schlichte, weiße Kragenbluse darüber. Sie hat dunk- 
les, schulterlanges Haar. Ihr Kopf ist beinahe vollständig ins Profil gedreht. 
Ihr Blick fällt auf die dritte Person rechts im Bild, die aus Fotogramm 1 be- 
kannt ist. Es handelt sich um einen Mann mit kurzen, brünetten Haaren und 
Schnurrbart. Er trägt über einer dunkelblauen Jeans ein hellblaues Hemd mit 
hochgekrempelten Ärmeln. Unter dem Hemd ist beim Kragen ein weißes 
Unterhemd erkennbar. Der Mann ist den Bildbetrachter/inne/n zu drei Vier- 
teln zugewandt. Sein rechtes Bein und sein Kopf weisen Richtung Bildmitte. 
Beide Arme sind angewinkelt. Die Finger der Hände stecken in den vorderen 
Hosentaschen. An der linken Hand trägt der Mann eine Uhr mit braunem 
Armband. 


Ikonografische Interpretation 


Zuzüglich der Informationen aus dem ersten Fotogramm lässt sich im vorlie- 
genden Bild der türkische Showmoderator Beyaz erkennen. Bei der Person in 
der Mitte dürfte es sich um eine Assistentin handeln, die vermutlich als Über- 
setzerin für Stefan Raab agiert. 
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b) Reflektierende Interpretation 


Planimetrische Komposition 


Abbildung 38: Planimetrie 


Das Bild ist annähernd symmetrisch. Die schwarzen, parallelen Hosenbeine 
der Assistentin stellen einen starken visuellen Kontrast dar. Zwischen ihnen 
entsteht ein Einschnitt, der das Bild vertikal in zwei annähernd gleich große 
Hälften teilt. Die Linie setzt sich bis ganz nach oben fort — entlang der unten 
spitz geöffneten Bluse über das mittig am Kragen befestigte Mikrofon und 
den rechten Fensterrahmen. Die Vertikalität des Bildes wird durch die links 
und rechts stehenden Personen Beyaz und Stefan Raab verstärkt, gleichzeitig 
aber auch abgemildert. Entlang ihrer zur Mitte gedrehten Körper sind leicht 
nach außen gekippte Vertikalen erkennbar. Insgesamt strebt dadurch das Bild 
symmetrisch wie ein Springbrunnen nach oben und außen. Dieser Befund 
steht im Kontrast zum ersten Fotogramm der Beyaz-Show, das planimetrisch 
von einer starken Horizontalität geprägt war. Wie ersichtlich, ist dieser 
Wechsel auf Leistungen der abgebildeten Bildproduzent/inn/en zurückzufüh- 
ren. 
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Perspektivische Projektion 


Abbildung 39: Perspektive 


Eine eindeutige Rekonstruktion der Perspektive ist aufgrund mangelnder 
Cues im Bild nicht möglich. Die gekrümmte Vorderkante des Podests im 
Mittelgrund könnte sowohl für eine Parallel- als auch eine Schrägperspektive 
sprechen. Bedingt durch die nach rechts hinten verlaufende Podestkante ent- 
steht der Eindruck einer leichten Schrägperspektive. Die annähernd gleich 
großen Männer im Vordergrund legen aber eher eine Zentralperspektive 
nahe. Zusammenfassend ist von zumindest einem Fluchtpunkt auszugehen, 
der sich auf der Mittellinie oder leicht rechts davon befindet. Die Horizontli- 
nie dürfte sich zirka auf Augenhöhe der Männer befinden, da das Gesicht von 
Beyaz den Bildbetrachter/inne/n frontal und unverzerrt zugewandt ist. Dies 
bedeutet, dass die Kamera nach unten geneigt sein muss, was sich auch darin 
dokumentiert, dass die Oberseiten von Podest, Sofa und Schreibtisch sowie 
der Fußboden gut erkennbar sind. 


Szenische Choreografie 


Wie der formulierenden Interpretation zu entnehmen, sind im Bild mehrere 
Personen erkennbar. Im Bildzentrum befinden sich drei Personen. Die linke 
von ihnen, der Showmoderator Beyaz, blickt und spricht frontal in Richtung 
der aufzeichnenden Kamera. Das am Boden sitzende Publikum wird von ihm 
nur in zweiter Hinsicht adressiert. Zwar ist er ihm in seiner Körperhaltung 
zugewandt, sein Blick geht jedoch über das Publikum hinweg. Die Haltung 
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von Beyaz‘ rechter Hand deutet auf eine argumentative oder erläuternde 
Geste hin. Mit seiner linken Hand hält er die Schulter der Assistentin fest, 
deren Blick nach rechts zu Stefan Raab gewandt ist. Dass es sich nicht nur 
um ein Abstützen der Hand, sondern tatsächlich um ein Festhalten an einer 
bestimmten Position handelt, dokumentiert sich sowohl am erkennbaren 
linken Daumen von Beyaz als auch deutlich in der Zeitlupenanalyse 4:41— 
4:50. Die Assistentin ist somit von Beyaz zwischen ihm und Raab in Position 
gebracht. Ihre Aufgabe an dieser Stelle scheint jedoch nicht klar definiert zu 
sein. Dies wird daran deutlich, dass Stefan Raab über die kleine Assistentin 
hinweg zu Beyaz blickt und lächelt. Raabs Hände stecken beide bis zur Hälf- 
te in den vorderen Hosentaschen seiner Jeans. Offensichtlich versucht er sie 
gerade hineinzustecken oder herauszuziehen, was einer gewissen An- 
strengung bedarf, da Jeanstaschen eng sind. Die Finger der linken Hand sind 
jedenfalls gut erkennbar. Wie die Zeitlupenanalyse 4:42-4:28 zeigt, handelt 
es sich dabei um eine „Verlegenheitsgeste“. 

Der Musiker in der rechten oberen Bildhälfte steht mit keinem anderen 
Bildakteur in Verbindung. Sowohl sein Blick als auch sein Körper sind vom 
zentralen Bildgeschehen abgewandt. Seine Tätigkeit bezieht sich somit offen- 
sichtlich auf Vorgänge, die außerhalb des Bildes stattfinden. Das Publikum 
am unteren Bildrand ist streng nach vorne hin orientiert. Aufgrund der Sitz- 
position am Boden ist davon auszugehen, dass es zu den Akteur/inn/en auf 
der Bühne aufblicken muss, um der Show zu folgen. 


Ikonologische bzw. Ikonische Interpretation 


Im Vergleich zu Fotogramm 1 fällt planimetrisch unmittelbar die Aufhebung 
der formalen Distanzierung durch die abgebildeten Bildproduzent/inn/en ins 
Auge. Dadurch, dass die Personen vom Podium heruntergestiegen sind, gibt 
es keine physischen Barrieren zum Publikum mehr. In dieser Position be- 
greift sich Beyaz klar in seiner Rolle als Showmoderator, wie an seiner auf- 
recht nach vorne gerichteten Körperhaltung, dem entschlossenen Blick und 
der Gestik der rechten Hand deutlich wird. Mit seiner linken Hand versichert 
er sich, dass sich auch die Übersetzerin an ihrem Platz befindet und von dort 
nicht fortbewegt. Diese scheint sich ihrer Position weniger sicher zu sein als 
Beyaz, lässt ihn gewähren und verharrt steif in der ihr zugewiesenen Lage. 
Lediglich ihren Kopf bewegt sie in Richtung Stefan Raab, der von ihr jedoch 
keine Notiz nimmt. Insgesamt entsteht dadurch der Eindruck, dass die Über- 
setzerin weder fixer Bestandteil der Show zu sein scheint noch im Vorhinein 
klar vereinbart wurde, in welcher Weise sie daran teilnehmen sollte. Offen- 
sichtlich ist jedenfalls, dass die konkrete Position und Rolle der Übersetzerin 
für sie selbst und für Stefan Raab im vorliegenden Bild nicht vollständig 
geklärt zu sein scheinen. Dies steht im Gegensatz zu ihrer klaren Positionie- 
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rung durch Beyaz sowie ihrer markanten Dreifachfokussierung im Bild: Die 
Übersetzerin ist in planimetrischer Hinsicht fokussiert und steht außerdem 
am nächsten zur Bildmitte. Im Gegensatz zu Stefan Raab hat Beyaz damit nur 
eine gewisse Kontrolle über die abgebildeten Bildproduzent/inn/en. Somit 
besteht eine deutliche Differenz zur Monostrukturierung der Sendung „Istan- 
bul Total“ (Bohnsack, 2009) oder „TV Total“ durch den Moderator Stefan 
Raab. Dieser dirigiert sowohl die abgebildeten wie die abbildenden Bildpro- 
duzent/inn/en. 

Verwirrung besteht in der Beyaz-Show nur für den uneingeweihten Kreis 
der abgebildeten Bildproduzent/inn/en. Im vorliegenden Falle gehört dazu 
auch Stefan Raab. Seine Orientierungslosigkeit dokumentiert sich insbeson- 
dere in seinem Blick zu Beyaz, aber auch in der — wie die Zeitlupenanalyse 
zeigt, sogar mehrfachen — Bemühung, durch Einstecken der Hände in die 
Hosentaschen lässige Entspannung zu vermitteln. 


6.3.5 Drittes Fotogramm: Songcontest Song 


Abbildung 40: Deutscher Songcontest-Song in der Beyaz-Show 
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a) Formulierende Interpretation 


Vorikonografische Interpretation 


Im Vergleich zum zweiten Fotogramm ist hier wieder etwas mehr vom Stu- 
dio zu sehen, gleichzeitig hat sich der Bildausschnitt nach links verschoben, 
sodass der rechte Fensterrahmen nun genau auf der Mittellinie des Bildes 
liegt. Am unteren Bildrand nimmt das Publikum wieder zirka ein Viertel des 
Bildes ein. Der Musiker am rechten Bildrand ist nur noch ansatzweise er- 
kennbar. 

Im Bildmittelgrund hat sich ein neues Ensemble formiert. Es sind nun 
vier Personen den Betrachter/inne/n frontal zugewandt. Beyaz und seine 
Assistentin stehen auf dem Podium, während vor ihnen Stefan Raab und links 
neben ihm ein Mann in hellbraunem T-Shirt und dunkler Hose auf Barho- 
ckern Platz genommen haben. Stefan Raab hat auf seinem rechten Ober- 
schenkel eine Gitarre aufgestützt. Seine linke Hand hält das Griffbrett. Beide 
Füße ruhen auf dem Fußraster des Barhockers. Der Mann neben ihm hält auf 
Brusthöhe einen kleinen Zettel in der linken Hand und hat seine Augen da- 
rauf gerichtet. Sein rechter Unterarm ruht auf dem rechten Oberschenkel, die 
Finger befinden sich in einer schnipsenden Position. Das linke Bein ist ange- 
winkelt, das rechte hängt am Barhocker hinunter. Vor beiden Männern befin- 
det sich auf Mundhöhe ein Mikrofonständer mit Mikrofon. Durch das En- 
semble der vier Personen sind der Schreibtisch sowie der rote Sessel fast 
völlig verdeckt. Im unteren Bildbereich ist die Schrift „(e)kleyemem aksama 
kadar canım“ auszumachen. Dies ist die türkische Übersetzung des Songtex- 
tes „Waiting until tonight, baby“. 


Ikonografische Interpretation 


Der neu hinzugekommene Mann heißt Max Mutzke und ist der deutsche 
Kandidat zum Eurovisions-Songcontest 2004. Er ist der Gewinner der spezi- 
ellen „TV-Total“-Show „SSDSGPS“ (Stefan sucht den Super-Grand-Prix- 
Star), die im Vorfeld des Songcontests stattfand. Max‘ Song wurde von Ste- 
fan Raab geschrieben und produziert. Aufgrund der Körperhaltung von Max 
und Raab sowie der verwendeten Gitarre ist anzunehmen, dass beide gerade 
gemeinsam singen. Bei der eingeblendeten Schrift handelt es sich um türki- 
sche Liedtexteinblendungen. 
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b) Reflektierende Interpretation 


Planimetrische Komposition 


Abbildung 41: Planimetrie 


Auf planimetrischer Ebene hebt sich die Personengruppe im Bildzentrum 
durch ihre runde Form von der sonst eher horizontal strukturierten Umge- 
bung ab. Durch diese Formation fällt das Bild jedoch keineswegs auseinan- 
der, da sich im Personenensemble auch Linien wiederfinden, die an die Um- 
gebung anschließen — so etwa die Vertikalen der Mikrofonständer oder die 
horizontal angeordneten Köpfe von Max und Raab. Auch das Griffbrett der 
Gitarre ist horizontal ausgerichtet. 
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Perspektivische Konstruktion 


À IN 


Abbildung 42: Perspektive 


Aus perspektivischer Sicht handelt es sich beim vorliegenden Bild erneut um 
eine Frontalperspektive. Der Fluchtpunkt befindet sich vermutlich auf der 
linken Hand von Beyaz, ist aber aus dem Bild nicht eindeutig rekonstruier- 
bar. Die Horizontlinie verliefe damit etwas oberhalb der Bildmitte auf Au- 
genhöhe von Max und Stefan Raab. 


Szenische Choreografie 


Im Wesentlichen sind alle vier Bühnenakteure den Betrachter/inne/n frontal 
zugewandt. Die einzige Ausnahme bildet Max, dessen Kopf ins Dreiviertel- 
profil gedreht ist. Er ist auch der Einzige, dessen Blick nicht zu den Bildbe- 
trachter/inne/n, sondern auf einen Zettel in seiner Hand’ gerichtet ist. Vor 
dem Bühnenensemble ist das ihm zugewandte Publikum zu sehen. Die Zu- 
schauer/innen sind allerdings nicht identifizierbar, sondern können nur an- 
hand der Rückseite ihrer Köpfe wahrgenommen werden. 


61 vermutlich ein sogenannter „Spickzettel“ mit dem türkischen Text des Liedes. 
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Ikonologische bzw. Ikonische Interpretation 


Im vorliegenden Fotogramm ist der Showmoderator Beyaz mehrfach fokus- 
siert. Er steht genau in der Bildmitte an oberster Position sowie im planimet- 
rischen Zentrum. Seine Hand befindet sich genau im Fluchtpunkt der per- 
spektivischen Projektion. Farblich hebt sich Beyaz noch zusätzlich durch 
seinen hellen Anzug von der Umgebung ab. In seinem Lächeln und seiner 
Gestik dokumentiert sich entspannte Zufriedenheit mit dem gegenwärtigen 
Bühnengeschehen. 

Im Gegensatz zum zweiten Fotogramm sind diesmal die Rollen klar ver- 
teilt und die genauen Positionen der Agierenden auf der Bühne vorgegeben. 
Stefan Raab und sein Songcontest-Kandidat Max Mutzke haben sich auf zwei 
Barhocker vor dem Publikum gesetzt und eine aktive Rolle als Musiker ein- 
genommen. Diese aus seiner eigenen TV-Show bzw. auch aus anderen Sho- 
wauftritten (z.B. bei Anke Engelke) vertraute Rolle stiftet deutlich Si- 
cherheit, wie an der entspannten Haltung Stefan Raabs sichtbar wird. 

Die Unsicherheiten und „Befremdungen“, die sich in Form von Distan- 
zierungen sowohl formal im Bild wiedergefunden als auch in Raabs Körper- 
haltungen (Gebärden) und Gesten dokumentiert haben, sind verschwunden. 
Wie den türkischen Liedtexteinblendungen entnommen werden kann, singt 
Stefan Raab jetzt sogar auf Türkisch. Letzteres wird daran deutlich, dass der 
Sänger Max Mutzke von einem Blatt Papier abliest, was bei seinem vertrau- 
ten Liedtext nicht nötig wäre. Die türkische Texteinblendung entspricht wohl 
sinngemäß den Worten des deutschen Songcontest-Liedes. 


6.3.6  Reflektierende Interpretation von Einstellungswechseln und 
Montage 


Im Kontrast zum Bildmaterial der Stefan-Raab-Shows ‚Istanbul Total“ und 
„IV Total“, wo Szenen- bzw. Sequenzwechsel in der Regel durch Zeige- 
oder Blickgesten des Moderators Stefan Raab dirigiert werden (vgl. auch 
Bohnsack 2008), fällt in der Beyaz-Show ein davon abweichendes Prinzip 
des Einstellungswechsels und der Montage auf. Dieses abweichende Prinzip 
ergibt sich aus den Leistungen zweier abbildendender Bildproduzenten — dem 
Produktionsteam der Beyaz-Show einerseits und dem Produktionsteam von 
„Istanbul Total“ andererseits. 

Deutlich wird dieser Umstand im Vergleich zweier Einstellungswechsel, bei 
dem jeweils kurz das Publikum in der eingelagerten Sequenz ES 1 zu sehen 
ist. Zum Zeitpunkt 4:06-4;07 wird US 1 durch ES 1 unterbrochen: Stefan 
Raab ist gerade auf die Bühne gekommen, winkt dem Publikum zu, das Pub- 
likum wird gezeigt. Anschließend wird die Sequenz US 1 fortgesetzt. Diese 
Sequenz entspricht einem für die Gattung der Fernsehshows typischen Mon- 
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tageschritt, bei dem durch einen Einstellungswechsel das Publikum als Ge- 
genüber des Bühnenperformers gezeigt wird. Empirisch lässt sich dies auch 
an der Eingangssequenz von „Istanbul Total“ verdeutlichen. Bei 1:08, 1:22- 
1:27, 2:27 etc. gibt es jeweils eingelagerte Sequenzen, auf denen das Publi- 
kum zu sehen ist. Besonders bei Applaus und Gelächter wird dieses Mittel 
häufig eingesetzt, um den Echtheitsgehalt dieser Ereignisse zu unterstreichen 
und darüber hinaus zu dokumentieren, dass der Raum der Show mehr als nur 
die Bühne umfasst. Im Sinne Hickethiers (1996) dient diese Vorgangsweise 
schließlich zur Herstellung des „filmischen Raums“. Ein wichtiges Charakte- 
ristikum dieses Montagetyps ist die Gleichzeitigkeit, die nur durch Parallel- 
montage hergestellt werden kann. Somit gilt als sehr wahrscheinlich, dass der 
vorliegende Einstellungswechsel vom Produktionsteam der Beyaz-Show 
vorgenommen wurde. 

Anders verhält es sich mit dem Einstellungswechsel 4:50/4:51. Auch hier 
wird eine laufende Untersequenz (US 5) von der Publikumseinstellung (ES 1) 
unterbrochen. Allerdings wird die einleitende Sequenz (US 5) danach nicht 
fortgesetzt, sondern von einer neuen Sequenz (US 6) abgelöst, auf der ein 
anderes Bühnenarrangement und andere Personen zu sehen sind. Damit kann 
es sich um keine Parallelmontage bzw. Bildmischung mehr handeln. Der 
daraus resultierende Bruch in der Zeitkoordinate ist ein typisches Zeichen 
einer sogenannten Postproduktion Der kontinuierliche Zeitablauf wird ge- 
rafft, für die abbildenden Bildproduzent/inn/en Irrelevantes herausgeschnit- 
ten. Nun wäre es zwar vorstellbar, dass die Beyaz-Show in der Türkei in 
geraffter Weise ausgestrahlt würde. Wenig wahrscheinlich ist allerdings, dass 
ausgerechnet der Gastgeber Beyaz mitten in seiner eigenen Show herausge- 
schnitten würde. Insbesondere aufgrund der herausgearbeiteten Personal- 
union zwischen abbildenden und abgebildeten Bildproduzent/inn/en erscheint 
dies wenig plausibel. Beim vorliegenden Einstellungswechsel kann es sich 
somit nur um eine Leistung der abbildendenden Bildproduzent/inn/en der 
„Istanbul-Total“-Show im Rahmen der Postproduktion handeln. Was die 
Zusehenden folglich im Rahmen dieser Darbietung der Beyaz-Show zu sehen 
bekommen, ist letztendlich kein Eindruck der Sendung an sich, sondern des- 
sen, was als Ergebnis der Postproduktion des „Istanbul-Total“-Teams ange- 
sehen werden kann. 


6.3.7 Fokussierungen: Steigerungen, Verdichtungen und 
Diskontinuitäten 


a) Fokussierungen im Bereich der Performanz der abbildenden 
Bildproduzent/inn/en 


In der Beyaz-Show gibt es keine fixen Kameras wie in „Istanbul Total“. Die 
gesamte Show wird entweder mit Handkameras oder mit einer an einem Kran 
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befestigten Kamera aufgenommen, die direkt über dem Publikum schwebt. 
Die Krankamera bewegt sich ständig frei im Raum und ermöglicht dadurch 
den Fernsehzuschauer/inne/n ein sehr unmittelbares Bühnenerlebnis. Seitens 
der abgebildeten Bildproduzent/inn/en kann diese Kamera rasch und spontan 
zum Einsatz gebracht werden, was auf Kosten perfekt ausgerichteter Ein- 
stellungen geht (etwa der Zentralperspektive). Es handelt sich dabei aber um 
visuelle Einschränkungen, die offensichtlich zugunsten der erhöhten Beweg- 
lichkeit in Kauf genommen werden. In „Istanbul Total“ kommen — neben 
Handkameras — für viele Einstellungen hingegen fixe Studiokameras zum 
Einsatz. Diese ermöglichen ein höheres Maß der Kontrolle über den Bildaus- 
schnitt und den Aufnahmewinkel, als dies bei einer Krankamera der Fall ist, 
die sich in allen drei Raumdimensionen bewegen kann. 


b) Fokussierungen im Bereich der Performanz der abgebildeten 
Bildproduzent/inn/en 


Als Fokussierung findet sich der sogenannte „Beyaz-Move“, wie Stefan Raab 
ihn stets bezeichnet. Es handelt sich dabei um eine eigentümlich rhythmische 
Bewegung der Arme und Beine, die Beyaz üblicherweise zu Beginn seiner 
Show zur Anwendung bringt. Der ,,Beyaz-Move“ wird von Stefan Raab 
nachgeahmt und sowohl beim Interview mit Beyaz” als auch bei der Beyaz- 
Show“ von ihm mehrmals ausgeführt. Wie Beyaz im Interview erklärt, habe 
er sich die Bewegungen seinerzeit aus dem Nachtprogramm des deutschen 
Privatfernsehens abgeschaut. Nun ist sie zu seinem Markenzeichen gewor- 
den. 

Zu Beginn der Beyaz-Show tritt Stefan Raab an Beyaz’ Stelle als Erster 
mit dem Beyaz-Move auf, was ihm einen sicheren und wirksamen Auftritt 
verschafft. Die anschließende spontane Kommunikation mit dem Publikum 
misslingt. Raab kommt weder mit seinen Gesten und seiner Sprache noch mit 
seinem Humor bei den Leuten an. Bei Beyaz‘ Auftritt wiederholt Raab zur 
Begrüßung den Beyaz-Move . Deutlich ist somit die Kommunikationsfunk- 
tion dieser Bewegung für Raab — Kommunikation sowohl mit dem Publikum 
als auch mit Beyaz. Gleichzeitig kopiert Raab dabei den Bewegungsablauf 
des türkischen Moderators.. Gelungene Kommunikation mit dem Türkischen 
ist somit — nach Vorstellung von „Istanbul Total“ — nur in der Nachahmung 
bzw. im Nachäffen von standardisiertem Verhalten möglich. Wie „Istanbul 
Total“ den Zusehenden zu verstehen gibt (dies ist in der Vorgeschichte zur 
Beyaz-Show massiv spürbar), ist die Nachahmung legitim, da die Türken ja 
selber alles von den Deutschen kopieren. Eine interessante Homologie zu 
dieser Erkenntnis findet sich auch auf der Textebene. Am Ende des Liedes 


62 am 11. Mai 2004, link: http://tvtotal.prosieben.de/tvtotal/videos/player/?contentId=14156 
63  http://tvtotal.prosieben.de/tvtotal/videos/player/?contentld=14157 
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fordert Raab das türkische Publikum mit dem türkischen Ausruf „Hep be- 
raber!“ („Alle zusammen!“) zum Mitsingen auf. Auch dieser Ausruf schlägt 
die Brücke zum Publikum, das mit Applaus antwortet. 

Das eingeübte türkische Handlungsrepertoire bewahrt den Moderator 
Stefan Raab somit davor, vor der Kamera als unsicher und hilflos bloßgestellt 
zu werden. Wie die komparative Analyse und das Beispiel der Beyaz-Show 
zeigen, scheitert Raab regelmäßig in Situationen, wo echte Spontaneität ge- 
fragt ist. Er ist eher Experte für das Sprunghafte, die Diskontinuitäten, die das 
„Raabhafte‘“ ausmachen. Aufschlussreiche Erkenntnisse über das Scheitern 
von Raab liefert die Interpretation der Text- bzw. Tonebene. 
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6.4 Interpretation in der Dimension von Text und Ton 
6.4.1 Text-Transkript 


Am=Stefan Raab, Bm=Beyaz, Cm=Off-Kommentator, Dm=Max Mutzke 


| 


Am: Locker, locker, vielen Dank, danke schön, danke schön. Hallo. Hallo. Mein Name 
ist Stefan Raab, ich komme aus Deutschland. 417 
L((mehrstimmiges Gelächter)) | 
Lund jetzt, ah, ja, und jetzt 
kommt euer Gastgeber. Hier ist Beyaz! 
“((Gebriill)) 
| ((Signation der Beyaz-Show (Melodie 

von „Anton aus Tirol“ mittürkischem Text)) 


“((Gebriill und Pfiffe)) ((Klatschen)) 
Bm: LEhh ((spricht türkisch PEON 
Cm: "Wir könnten 


natürlich jetzt das übersetzen, lassn wa aba. Der Chefhatja auch nichts 
verstanden. Zum Glück gibt es aber eines, was alle verstehen. 

Dm: LOhhho ((singend)) 

Cm: “Musik! 

Am+Dm: LJust can't wait until 
ton::ight, baby, till I have you by my alde, ((singend)) ba::byjust can’t wait until 


to- 

Cm: “aba Stefan Raab ware nicht Stefan Raab, 
wenn er sich nicht noch was Besonderes ausgedacht hatte, 

Am+Dm: “night, baby 

Cm: und so haben 
Stefan und Max natiirlich noch eine Uberraschung mitgebracht 

Am+Dm: “((selbes Lied auf 
Türkisch gesungen)) 

?m: Lone more time 

_((Gitarreninstrumental)) 
Am+Dm: "Düdüdü düduuuu 
5:31 


Am: Hep beraber! ((„Alle zusammen“ aufTürkisch)) 
‘((mehrstimmiges Gelächter)) 


5:36 
((Klatschen und Pffte)) 
Am: Hep beraber! 
Cm: “Damit haben wir die Türken wohl endgültig auf unserer 


Seite. Danke Beyaz! 
L((Schlussakkorde, Klatschen, Brüllen und Pfiffe)) 
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6.4.2 Formulierende Interpretation des Textes: Thematische 
Gliederung 


OT: 4:08-4-23 Begrüßung 


UT: 4:08-4:12 Lockerer Dank 
UT: 4:13-4:15 Stefan Raab aus Deutschland 
UT: 4:17-4:23 Der Gastgeber Beyaz 


OT: 4:46-5:00 Verstehen 


UT: 4:46-4:50 Was auch der Chef nicht versteht, muss nicht übersetzt 
werden 
UT: 4:51-5:00 Musik verstehen alle 


OT: 5:01-5:40 Überraschungen 


UT: 5:01-5:10 Stefan Raabs besondere Überraschung 
UT: 5:31-5:36 Alle zusammen (,,Hep beraber!“) 
UT: 5:36-5:40 Dank Beyaz sind die Türken auf unserer Seite 


6.4.3  Reflektierende Interpretation in der Dimension des Textes und 
Tones 


OT: 4:08-4-23 Begrüßung 
UT: 4:08-4:12 Lockerer Dank 


Homolog zur Einschatzung auf der Ebene der Gestik und Montage sind Ste- 
fan Raabs Worte zu Beginn der Beyaz-Show von Unsicherheit gepragt. Sein 
erstes Wort ist „Locker“ kombiniert mit einer Beschwichtigungsgeste. Da- 
nach wird dem Publikum für seinen Applaus gedankt, was einer standardi- 
sierten und ritualisierten Handlung im Showkontext entspricht. Beide As- 
pekte weisen auf eine gewisse Unsicherheit des Moderators Stefan Raab hin. 


UT: 4:13-4:15 Stefan Raab aus Deutschland 


Im Modus der Unsicherheitsbewältigung folgen mit der Begrüßung („Hallo“) 
und der Vorstellung (,,Hallo. Mein Name ist Stefan Raab. Ich komme aus 
Deutschland“) weitere standardisierte Handlungen, die im Alltagskontext oft 
beim erstmaligen Kontakt mit Fremden gesetzt werden. Aus der Reaktion des 
Publikums (Gelächter) ist jedoch erkennbar, dass diese Art der Vorstellung 
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eine komische Note besitzt.‘ Der Bewältigungsversuch war erfolglos, das 
Thema der Unsicherheit ist nicht vom Tisch. Im weiteren Sprechen von Ste- 
fan Raab dokumentiert sich Irritation bei dem gleichzeitigen Versuch, einen 
neuen Bewältigungsansatz zu finden („Und jetzt, äh, ja, und jetzt kommt 
[...]“). Es folgt ein erneuter, dreimaliger Ansatz. 


UT: 4:17-4:23 Der Gastgeber Beyaz 

Erst der letzte Ansatz löst die Situation der Unsicherheit, indem Stefan Raab 
sein Wort an den türkischen Showmoderator Beyaz abgibt. Dieser bedient 
sich in türkischer Sprache eines ähnlichen Begrüßungsmodus wie Stefan 
Raab, verkörpert diesen aber mit weniger Unsicherheit. Im Gegensatz zur 
Vorstellung Stefan Raabs bleibt Beyaz’ Redefluss kontinuierlich, ohne Pau- 
sen und Brüche. Das Publikum bleibt ruhig. 


OT: 4:46-5:00 Verstehen 


UT: 4:46-4:50 Was auch der Chef nicht versteht, muss nicht übersetzt wer- 
den 


An dieser Stelle setzt ein Kommentar aus dem Off ein: „Wir könnten natür- 
lich jetzt das übersetzten, lassn wa aba. Der Chef hat ja auch nichts verstan- 
den.“ Was vom türkischen Moderator Beyaz gesagt wurde, wird einfach nicht 
übersetzt. Die Begründung wird lediglich nachgeliefert. Darin dokumentieren 
sich zwei Bedeutungsgehalte. Mit der Begründung, der Chef habe ja auch 
nichts verstanden, wird einerseits Beyaz, dem eigentlichen Chef der Sendung, 
die Geltung entzogen. Andererseits fungiert diese Begründung auch als 
Rechtfertigung für den Entzug des Wortes sowie für die Handlungen, die 
bereits auf anderen Interpretationsebenen herausgearbeitet wurden: Der On- 
Ton der Show wird leiser gemacht und eigene, neue Anschlüsse für die Mon- 
tage werden gesetzt. Nachdem Stefan Raab also aus Gründen der Unsi- 
cherheit in der fremden Situation sein Wort an Beyaz abgegeben hatte, wird 
es nun — stellvertretend für ihn — Beyaz wieder entzogen und Raab damit eine 
erneute Bewältigungschance eröffnet: „Musik“. 


UT: 4:51-5:00 Musik verstehen alle 


64 Eine ähnlich deplatzierte Äußerung macht Raab übrigens auch beim Interview mit der 
Deutsch-Türkin Nina Öger. Als diese ihm zum Abschluss für seine Bemühungen um Istan- 
bul dankt, rutscht ihm die Floskel heraus: „Es lohnt sich wirklich hierher [nach Istanbul] zu 
kommen. Das kann ich ihnen nur empfehlen.“ 
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Musik wird „von allen verstanden“ und damit als positiver Horizont zur 
Überwindung von Sprach- und Kulturgrenzen hervorgehoben. In diesem 
Rahmen singt Max seinen Songcontest-Song in englischer Sprache: „Can’t 
wait until tonight, baby“, den, so wird suggeriert, verstehe man in Deutsch- 
land und der Türkei. 


OT: 5:01-5:40 Überraschungen 
UT: 5:01-5:10 Stefan Raabs besondere Überraschung 


Nach den Worten des Kommentators ist Raab ein besonderer Mensch, der 
sich „Besonderes einfallen lässt“ (5:01) und damit die Leute überrascht. Das 
Besondere hat demnach mit Überraschung zu tun, ein Element, das sich in 
vielen Handlungen Stefan Raabs wiederfindet. Die besondere Überraschung 
besteht offensichtlich darin, das Lied auf Türkisch zu singen. Dies ist vor 
allem deshalb bemerkenswert, da zuvor der türkische Text von Beyaz wegge- 
regelt wurde, da „der Chef“ (Stefan Raab) diesen nicht verstanden habe. 
Auch an anderen Stellen von „Istanbul Total“ wird wenig Wert auf türkische 
Übersetzung gelegt. Beispiele sind etwa das Interview mit der türkischen 
Bauchtanzlehrerin oder die Äußerungen des Kapitäns des Feuerwehrschiffs. 
An vielen anderen Stellen hingegen wird das Türkische explizit verballhornt 
oder bewusst als Kauderwelsch missverstanden, wie in den Sequenzen „Ali- 
dissimo“, „Elton vor der Beyaz-Show“ (,,Wadde-Hadde-du-de-da“, 562-00- 
05, 1:50) oder „Feuerwehrschiff“ („Wir sind hier in einem Dance-Külübü“, 
563-00-01). Das intendierte Missverstehen von Sprachen findet sich auch in 
der Stefan-Raab-Show „TV Total“ relativ häufig, etwa in der Sequenz „Le- 
bensmittelmesse“. Dort wird auf Eigentümlichkeiten der französischen Spra- 
che herumgeritten. So manches Mal beinhalten die Missverständnisse auch 
eine sexuelle Konnotation, beispielsweise in der Sequenz „Elton und Gülcan 
1“ (561-00-03). Gülcan spricht auf Türkisch und Elton antwortet: „Ja das 
machma dann später im Hotel, ähm.“ 


UT: 5:31-5:36 Alle zusammen (Hep beraber) 


Stefan Raab und Max singen den Text vom Blatt. Völlig frei skandiert Stefan 
Raab dann zweimal „Hep beraber!“ (auf Deutsch: „Alle zusammen!“). Wie 
bereits an früherer Stelle dargelegt, dokumentiert sich darin die Nachahmung 
eines standardisierten Ausrufs mit der Erfolgsgarantie, das türkische Publi- 
kum zu erreichen. Dieses antwortet erwartungsgemäß mit Applaus, was in 
der abschließenden Rahmung des Off-Kommentators als umfassende Zu- 
stimmung zu Raab und seiner Show zu werten ist. 


UT: 5:36-5:40 Dank Beyaz sind die Türken auf unserer Seite 
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Der Off-Text signalisiert eine „geglückte“ Verständigung und dokumentiert 
den Anspruch von „Istanbul Total“: „Damit haben wir die Türken wohl end- 
gültig auf unserer Seite.“ Das Gemeinsame zwischen Deutschen und Türken 
wird also bestenfalls durch eine Verbündung gegen Dritte realisiert, wobei 
die Türken dabei eindeutig instrumentalisiert werden. Letztlich impliziert die 
getätigte Aussage ja auch, dass man sich selber nicht auf die Seite der Türken 
schlagen kann. Dies korrespondiert mit der erklärten Zielsetzung von ,,Istan- 
bul Total“ — 12 Songcontest-Punkte für Max -, die gebetsmühlenartig in 
verschiedenen Kontexten der Show hervorgehoben wird. 

Der abschließende Ausruf aus dem Off, „Danke, Beyaz!“, besitzt im 
Kontext von „Hep beraber!“ eine freundschaftliche Note. Vor dem Hinter- 
grund dessen, dass Beyaz zuvor das Wort und die Kontrolle über seine eigene 
Show entzogen wurde, erhält diese Aussage zynische Züge. Der Dank wird 
Beyaz letztlich dafür ausgesprochen, dass er Stefan Raab und Max seine 
Bühne für ihr eigenes Programm überlassen hat. Letztlich reichte das Inte- 
resse an ihm und seiner Show nur so weit, wie er für die Vermarktung von 
Raab, Max und „Istanbul Total“ von Nutzen war. 


6.5 Reflektierende Gesamtinterpretation 


Am zweiten Sendetag von „Istanbul Total“ wird die Beyaz-Show als türki- 
sches Pendant zur Sendung ,,TV Total“ des Moderators Stefan Raab präsen- 
tiert. Dieser 1:1-Vergleich wird dadurch nahegelegt, dass die Beyaz-Show im 
Wesentlichen nichts anderes als eine „abgekupferte“ Version von „TV Total“ 
sei. Die Vorgehensweise der Stereotypisierung der Türken als unbeholfene 
Nachahmer wurde in dieser Arbeit sowie von Bohnsack (2009) bereits mehr- 
fach erwähnt. Die Rahmung der Beyaz-Show fügt sich nahtlos in diesen 
Kontext ein. 

In der Beyaz-Show dokumentieren sich jedoch auch Nachahmungsleis- 
tungen des deutschen Moderators Raab, die legitimiert werden müssen. Dies 
gelingt dadurch, dass diese Nachahmungen entweder ironisierend verkleidet 
oder — entsprechend der öffentlichen PR von „Istanbul Total“ — als „kultur- 
verbindender Briickenschlag“ dargestellt werden. Die Präsentation von Ste- 
fan Raab als „interkulturellen Brückenbauer“ immunisiert ihn gegen die 
unmittelbare Zuschreibung egoistischer Motive, wie sie durch eine „Hyper- 
zentrierung“ (Bohnsack, 2009, S. 234) auf seine Person entstehen könnten. 
Bei genauerer Betrachtung dokumentiert sich dennoch die unilaterale Aus- 
nutzung der Beyaz-Show durch „Istanbul Total“ auf sämtlichen Interpreta- 
tionsebenen. 
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6.5.1 Der Gebrauchswert von Faksimiles und Pendants 


Im Rahmen der Beyaz-Show kommt dem türkischen Stereotyp des Nachah- 
mens und Fälschens eine produktive Bedeutung zu. Es eignet sich perfekt zur 
Verdoppelung medialer Ereignisse, was dem „parasitären Aufmerksamkeits- 
gewinn“ von „Istanbul Total“ (Bohnsack, 2009, S. 238) zuträglich ist. Nach- 
dem die Beyaz-Show als türkische Kopie der Raab-Show entlarvt ist, liegt 
offensichtlich nichts näher, als Stefan Raab an dieser Show teilnehmen zu 
lassen und Beyaz zu „Istanbul Total“ einzuladen“. 

In diesem Wechselspiel kann selbst Raab sich „kleine Gaunereien“ er- 
lauben (sonst Stereotyp der Türken), die zur kulturellen Verständigung bei- 
tragen. Der nachgemachte Beyaz-Move etwa sowie die türkischen Worthül- 
sen (z. B. „Hep beraber!“), die Stefan Raab beim Singen einsetzt, generieren 
jedenfalls die gewünschte Zustimmung des Publikums. Wie gleich zu Beginn 
der Sendung ersichtlich ist, scheitert Raab mit anderen Kommunikationsbe- 
mühungen kläglich. Im Orientierungsrahmen von „Istanbul Total“ stellt die 
Nachahmung somit die einzige funktionale Möglichkeit zur interkulturellen 
Kommunikation dar. 


6.5.2 Instrumentalisierung des Türkischen zur Selbstinszenierung 


Je weiter die Analyse der Sendung „Istanbul Total“ voranschreitet, desto 
deutlicher wird, dass die „türkische Innenwelt“ (Bohnsack, 2009, S. 237) 
nicht von Interesse ist. Das Türkische entfaltet seine Relevanz lediglich in 
Kontexten, die der Selbstinszenierung des Moderators Stefan Raab bzw. der 
Vermarktung seiner Person sowie der Show insgesamt dienlich sind. Dieser 
Umstand dokumentiert sich in der Beyaz-Show auf zwei Arten: einerseits im 
offenkundigen Desinteresse am Türkischen auf der Ton- und Textebene. In 
Minute 4:46 werden die Äußerungen des türkischen Moderators einfach 
unübersetzt mit der Begründung ausgeblendet: Was der Chef (d. h. Stefan 
Raab) nicht versteht, muss auch nicht übersetzt werden. Andererseits bedient 
sich gerade dieser „Chef“ der türkischen Sprache, um in seiner Gesangsein- 
lage mit Max Aufmerksamkeits- und Popularitätsgewinne zu erreichen. 


6.5.3 Die Immunisierung des Moderators von „Istanbul Total“ 


Bei der Betrachtung des Videomaterials der Beyaz-Show wird deutlich, dass 
das in „Istanbul Total“ aufgeworfene Stereotyp der Türken als ungeschickte 


65 Beyaz tritt seinerseits am 11. Mai 2004 in der Sendung „Istanbul Total“ auf. Link: 
http://tvtotal.prosieben.de/tvtotal/videos/player/?contentld=14156 
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Akteure brüchig zu werden droht. Stefan Raab verhält sich zu Beginn der 
Show überaus unbeholfen (vgl. Fotogramm 1), während der türkische Mode- 
rator Beyaz selbstsicher die Sendung leitet (vgl. Fotogramme 2 u. 3). Allein 
auf der Basis der Leistungen der abgebildeten Bildproduzent/inn/en wäre 
dieses Videomaterial folglich nur bedingt für den Einsatz in „Istanbul Total“ 
geeignet, da es im Widerspruch zu den dort wirksamen Orientierungen steht; 
insbesondere der „Inszenierung von Spontaneität“ und der „Hyperzentrierung 
auf die Person des Moderators“ Stefan Raab (Bohnsack, 2009, S. 234). 

Als letzte Möglichkeit zur Aufrechterhaltung der bestehenden Showkon- 
zepte bleibt nur die Postproduktion, d. h. der Rückgriff auf Leistungen der 
abbildenden Bildproduzent/inn/en. Dazu wird das fertige Videomaterial der 
Beyaz-Show einer nochmaligen Montage durch das Produktionsteam von 
„Istanbul Total“ unterzogen. Resultat: Beyaz wird über den Off-Text die 
Kontrolle über seine Show entzogen und diese im Sinne von „Istanbul Total“ 
„solide“ zu Ende geführt. „Istanbul Total“ hat somit über die Montage im 
Nachhinein die Möglichkeit, Medienereignisse für sich zu nutzen und zu 
vereinnahmen sowie sogar den Moderator Stefan Raab gegen eigene Fehl- 
leistungen zu immunisieren. 


6.5.4 Monostrukturierung in „Istanbul Total“ und der Beyaz-Show 


Zum Prinzip der „Monostrukturierung durch den Showmaster“ (Bohnsack, 
2009, S. 240) können nach Durchführung der komparativen Analyse zwei 
aufschlussreiche Punkte festgehalten werden. Zum einen konnte anhand der 
Leistungen der abgebildeten und abbildenden Bildproduzent/inn/en der türki- 
schen Beyaz-Show gezeigt werden, dass die Monostrukturierung auch in 
anderen Fernsehsendungen wirksam ist — alleine der Titel „Beyaz-Show“ ist 
ein deutlicher Beleg dafür. 

Zum anderen konnte anhand des vorliegenden Videomaterials gezeigt 
werden, wie auf Bedrohungen der ,,Monostrukturierung durch den Show- 
master“ reagiert wird. Im vorliegenden Falle erfolgte die Gefährdung durch 
die unzureichenden Leistungen des abgebildeten Bildproduzenten Stefan 
Raab sowie durch den offenkundigen Interessenskonflikt divergierender 
abbildender Bildproduzent/inn/en (‚Istanbul Total“ und Beyaz-Show). Was 
die Struktur der Machtverhältnisse anbelangt, so wird im Falle der Videoin- 
terpretation der Beyaz-Show deutlich, wessen Rahmungen sich letztlich 
durchsetzen, wenn mehrere abbildende Bildproduzent/inn/en involviert sind: 
Es sind die Rahmungen derer, die die Entscheidungsgewalt über die End- 
montage besitzen — ungeachtet dessen, welche Leistungen durch die abgebil- 
deten Bildproduzent/inn/en ursprünglich erbracht wurden. 
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7 Orientierungsrahmen und Abgrenzungshorizonte 
von „Istanbul Total“ 


Die vorhergehenden Kapitel „Istanbul Total: Eingangspassage“ (Kapitel 5) 
und „Istanbul Total: Die „Beyaz Show“ (Kapitel 6) hatten u.a. zum Ziel in 
die Forschungspraxis der Film- und Videointerpretation nach der Dokumen- 
tarischen Methode einzuführen und dabei zugleich wichtige Eckpunkte des 
Dokumentsinns der Fernsehsendung „Istanbul Total“ herauszuarbeiten (z.B. 
zentrale Mechanismen, wie Distanzierung oder ironisierende Herabwürdi- 
gung des „Türkischen“. In der Folge werde ich nun demonstrieren, wie sich 
die Rekonstruktion des dominierenden Orientierungsrahmens der Sendung 
durch das Aufspüren weiterer positiver und negativer Abgrenzungshorizonte 
vertiefen lässt. Dabei ist es erforderlich den Blick nun stärker auf den Ge- 
samtkontext der Fernsehsendung „Istanbul Total“ zu richten. Wie bereits an 
mehreren Stellen der Interpretation deutlich wurde, kann das „Türkische“ 
(ganz entgegen des Titels der Show) offensichtlich als negativer Abgren- 
zungshorizont der Show angesehen werden, dem der Moderator Stefan Raab 
als positiver Orientierungshorizont gegenübersteht. Die Sendung ist somit 
insgesamt durch eine starke Polarisierung gekennzeichnet. Zugleich scheint 
die positive Rahmung der Moderatorfigur (und damit der Sendung) fast aus- 
schließlich ex negativo zu erfolgen, d.h. durch negative Abgrenzung von 
allem, was anders (als der Moderator bzw. die Sendung) ist. Entgegen der 
Programmatik des Sendungstitels „Istanbul Total“ wird das Türkische bzw. 
Orientalische demnach nicht in seiner vielschichtigen Gesamtheit, sondern 
nur in (vom Moderator bzw. von der Sendung) ausgewählten, problemati- 
sierten Teilaspekten behandelt (bspw. die kleinen Gaunereien, Unaufrichtig- 
keiten, Sexismen der „Türken“). Der funktionale Wirkmechanismus der Un- 
terhaltungssendung „Istanbul Total“ besteht damnach darin, von Seiten des 
Moderators zuerst das Türkisch-Orientalische (in a priori distanzierter Hal- 
tung‘®) als etwas Fremdartiges zu konstruieren, es danach negativ zu beset- 
zen, um abschließend in Abgrenzung davon die eigene (moralische, intellek- 
tuelle etc.) „Überlegenheit“ zu präsentieren. Der eigentliche „Witz“ der Fern- 
sehshow liegt darin, wie die zur Schau getragene seichte Unterhaltung in 
scheinbar entspannter Atmosphäre (deren Präsentation auf der Ebene des 
Common-Sense im Vordergrund steht) über die Ernsthaftigkeit und Be- 
stimmtheit dieser Eingriffe hinwegzutäuschen vermag. Dem Moderator 
kommt die absolute und unangefochtene Deutungsmacht zu. Sämtliche Sen- 


66 Auf formaler Ebene dokumentiert sich die Distanzierungshaltung im Bild u.a. in der Ver- 
kleidung des Moderators als osmanischer Sultan, seiner erhöhten und abgezäunten Position 
auf dem Balkon des Fernsehstudios über der Stadt, seiner großen Entfernung zum gegen- 
überliegenden asiatischen Ufer etc. 
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dungsaspekte sind seiner Monostrukturierung untergeordnet. Am deutlichsten 
dokumentiert sich das auf der Ebene von Einstellung und Montage. Die Ka- 
mera, die den Moderator zentral ins Bild rückt, folgt buchstäblich jedem 
Fingerzeig. In der Postproduktion werden nachträglich unvorteilhafte Patzer 
des Moderators entfernt bzw. durch Hinzufügen von Gestaltungselementen 
der ursprüngliche Sinn der Aufnahmen zu seinen Gunsten (und zugleich auf 
Kosten der beteiligten autochthonen Türken) verändert. Abschließend stellt 
sich die Frage, wie sich die Grundorientierung der Monostrukturierung noch 
weiter differenzieren lässt. Das konkrete Vorgehen möchte ich anhand des 
Vergleichs weiterer Ausschnitte der Fernseh-Show „Istanbul Total“ mit tou- 
ristischen Reisevideos über die Stadt Istanbul erläutern. 


7.1 Sexismus: Schüren und Distanzieren 


In der Fernsehsendung „Istanbul Total“ (wie auch in der Version des Mu- 
sikvideos ,,Araba“ (2004) für den internationalen Markt; siehe Kap. 0) ist die 
prinzipielle Gleichwertigkeit von Männern und Frauen ein positiver Orientie- 
rungshorizont, der durchgängig implizit wirksam ist, ohne offen thematisiert 
zu werden. In verdeckter Weise manifestiert sich der Stellenwert der Gleich- 
wertigkeit der Geschlechter am vom Moderator Stefan Raab immer wieder 
aufgeworfenen, negativen Gegenhorizont des Sexismus, den er den „Türken“ 
im Rahmen der Sendung „Istanbul Total“ laufend unterstellt. Dabei werden 
tatsächlich sexistische Aussagen und Handlungen ausschließlich von zwei 
Assistenten des Moderators (von Elton und dem Off-Kommentator‘’) getä- 
tigt. Sowohl die Abgrenzung gegenüber „den Türken“ im Allgemeinen als 
auch gegenüber seinen Assistenzen im Konkreten erlaubt es dem Moderator 
Stefan Raab offen zu bekunden, dass er auf der „richtigen Seite“ stehe. Von 
moralisch sicherem Standort aus kann er mit dem Finger auf „türkische Ste- 
reotypen“ zeigen und seine negativen Fremdzuschreibungen rechtfertigen. 
Ein gutes empirisches Beispiel für die deutliche negative Zuschrei- 
bungstendenz in Hinblick auf Sexismus in „Istanbul Total“ ist die kompara- 
tive Analyse der „Harems-Sequenz“ (1. Sendetag von „Istanbul Total“) mit 
dem ZDF-Reisevideo „Reiselust Istanbul“. In beiden Fällen wird der Top- 
kapi-Palast gezeigt, wobei dem „faszinierendste[n] Teil des Topkapi-Palas- 
tes“ (Reiselust Istanbul, 5:16), dem Harem, jeweils beinahe der gesamte 
Beitrag gewidmet ist. Im Gespräch mit dem türkischen Reiseführer stellt 
Stefan Raab unablässig anzügliche Fragen im Hinblick auf das Sexualleben 
des Sultans: „Was war der beste Anmachspruch vom Sultan? Weiß man das? 


67 vgl. Beyaz-Show in Kap. 6 
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... Mach hin Alte, ich bin der Sultan.“ (Istanbul Total, 562-00-03, 2:55). Der 
Harem wird in diesem Kontext somit auf dem Niveau eines Bordells abge- 
handelt, wobei der negative Orientierungsrahmen des Sexismus dabei von 
Raab selbst vorgegeben wird. Im ZDF-Reisevideo werden demgegenüber auf 
der Bild- und Textebene das Geheimnisvolle des Harems (,,Harem kommt 
aus dem Arabischen und bedeutet unzugänglich“, Reiselust Istanbul, 5:22) 
sowie die sozialen Errungenschaften der dort lebenden Frauen betont („Kaum 
bekannt ist jedoch, dass die Frauen im Harem eine ganz normale Ausbildung 
erhielten“, Reiselust Istanbul, 5:38). 


Abbildung 43: Interview Nina Öger (4:23) 


Im Kontrast zur Haremssequenz und zum mutmaßlich stereotypen, sexisti- 
schen Verhalten der Türken übt sich der Moderator Stefan Raab in anderen 
Situationen in — für seine Verhältnisse (d. h. verglichen mit anderen Stereo- 
typen, die von ihm in der Show elaboriert werden) — fast demütiger Ergeben- 
heit gegenüber jenen Frauen, die zum Interview in sein Studio eingeladen 
sind. In einem ausgewählten Fotogramm (Abbildung 43) aus der Interview- 
sequenz mit Nina Öger, der Geschäftsführerin von Öger Tours (des weltweit 
größten Reiseunternehmens für Türkeireisen), wird dies schon auf den ersten 
Blick erkennbar. Stefan Raab sitzt seiner Interviewpartnerin in gebückter 
Körperhaltung gegenüber. Formal betrachtet handelt es sich um eine egalitäre 
Raumaufteilung. Sogar modisch hat sich der Moderator seinem gegenüber 
angepasst (beide tragen Bluejeans mit dunklem Sakko). Das exzentrische 
Sultansgewand der Eingangspassage (siehe Kap. 5) hat er abgelegt. 

In der Gesprächssituation des Studiointerviews gibt Raab Frau Öger 
durchaus Raum für ihre persönlichen Äußerungen und unterlässt Schlüpfrig- 
keiten wie jene in der Haremsequenz. Dies ist umso bemerkenswerter, als die 
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Haremsequenz in der Sendung direkt an das Interview mit Nina Öger an- 
schließt. Gegenüber Frau Öger bemüht sich Raab sogar um die korrekte tür- 
kischer Aussprache des Wortes „Topkapı“ während von ihm die türkische 
Sprache im Rest der Sendung entweder ignoriert, absichtlich missverstanden 
oder verballhornt (s. u.) wird. So wie bereits gegenüber der Interviewpartne- 
rin Gülcan (vgl. Bohnsack, 2009) erlaubt sich Raab in der Gesprächssituation 
mit einer (nach westlichen Maßstäben) beruflich erfolgreichen Frau lediglich 
stereotype Äußerungen über die kleinen Gaunereien der Türken beim Her- 
stellen, Verkaufen und Handeln von Waren. Während die Gleichwertigkeit 
zwischen Mann und Frau damit in den Interviews der „Istanbul Total“ als 
scheinbar ernsthaftes gesellschaftliches Anliegen behandelt wird, ist in der 
restlichen Sendung die dumpfe Gleichmacherei zwischen den Geschlechtern 
vorherrschend. 


Abbildung 44: Elton & Gülcan 1 (0:52) 


Der Mechanismus der dumpfen Gleichmacherei zwischen den Geschlechtern 
lässt sich empirisch gut anhand der Episoden mit dem Titel „Elton & Gülcan 
unterwegs in Istanbul“ verdeutlichen. Zu mehreren Zeitpunkten während der 
viertägigen Show „Istanbul Total“ zeigt Stefan Raab den Fernsehzuse- 
her/inne/n voraufgezeichnete Videoeinspielungen, in denen sein Assistent 
Elton und die deutsch-türkische Fernsehmoderatorin Gülcan die Stadt Istan- 
bul erkunden. In einer der Folgen besuchen Elton und Gülcan eine türkische 
Modeboutique, in der sie Frauenkleider anprobieren. Anhand der nachfol- 
genden Bilder möchte ich den Ablauf kurz skizzieren. In Abbildung 44 ist 
der Beginn der Videoeinspielung zu sehen. Noch ist der von Stefan Raab 
aufgeworfene positive Horizont der Gleichwertigkeit von Mann und Frau 
formal aufrecht. Analog zum Interview von Raab und Öger (Abbildung 43) 
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sind Elton und Gülcan relativ egalitär ins Bild gesetzt, wie sich in deren 
Kleidung, Körperhaltung, Raumaufteilung etc. dokumentiert. 


Abbildung 45: Elton & Gülcan 1 (2:12) 


In Abbildung 45 stehen sich Elton und Gülcan nun nach dem Umkleiden in 
der türkischen Modeboutique gegenüber und zeigen sich gegenseitig ihre 
Kleidungsstücke. Erneut scheint formal der Modus der Gleichwertigkeit 
aufrecht, dieser wird jedoch inhaltlich vom Moderatorassistenten Elton 
durchbrochen. Sowohl Elton als auch Gülcan tragen nun keine unisex-Klei- 
dung mehr, sondern dezidiert die idente modische Frauenkleidung — jeweils 
ein bauchfreies Top und Hotpants. Zwar ist die Raumaufteilung zwischen 
beiden Personen im Bild nach wie vor ausgewogen. Die anfängliche Gleich- 
wertigkeit von Elton und Gülcan (Abbildung 44) durch Eltons unangemesse- 
nes Erscheinen jedoch in zweierlei Hinsicht ins Lächerliche ab. Lächerlich ist 
zum einen, dass die Frauenkleidung für Eltons immense Körperfülle viel zu 
knapp ist, was ihn auch als Mann unvorteilhaft erscheinen lässt. Zum anderen 
stellt es nach gesellschaftlicher Konvention eine Abwertung dar, wenn Frau- 
en zum selben Anlass das gleiche Kleid tragen. 


143 


Abbildung 46: Elton & Gülcan 1 (3:30) 


In Abbildung 46 findet Eltons Raumnahme nun ihren vorläufigen Höhepunkt. 
In einem braunen Damenbadeanzug mit goldenen Ornamenten hat er die 
Bildmitte eingenommen. Gegenüber seiner Körperfülle wird die zierliche 
Gülcan förmlich an den Bildrand gedrängt. Die ursprüngliche Gleichwertig- 
keit des gemischtgeschlechtlichen Moderatorenduos ist vollends dem Pri- 
mat(en) der Verballhornung des Weiblichen gewichen. Neben dem poltern- 
den Elton hat nichts anderes und niemand anderer mehr Platz. Bald, so kann 
man den Eindruck gewinnen, platzt nicht nur Elton, sondern auch die kleine 
Boutique, in der er sich befindet, aus allen Nähten. Der dicke Mann im Da- 
menbaden braucht eine breitere Bühne. Zum Abschluss der Szene öffnet 
Elton dann auch sogar die Tür und geht alleine (ohne Gülcan) hinaus auf die 
Straßen von Istanbul, wo er sich der lokalen türkischstämmigen Öffentlich- 
keit der Passanten präsentiert. Durch die Ausstrahlung der Sendung im Fern- 
sehen erreicht die durch Elton in seinem Badeanzug personifizierte Verball- 
hornung der Geschlechtergleichstellung schließlich auch noch die Öffentlich- 
keit noch Millionen von deutschsprachigen Zusehern vor ihren TV-Geräten. 

Durch Eltons Körperfülle entsteht in den knappen Frauenkleidern eine 
ironische Brechung des männlichen Geschlechtsstereotyps (Abbildungen 45 
und 46). Der dicke Elton macht sich in Damenkleidern eigentlich lächerlich. 
Dadurch, dass er seine eigene Lächerlichkeit so offen zur Schau trägt, wirkt 
er zugleich aber auch irgendwie cool. Damit ist Eltons Performance letztlich 
jedoch ebenso sexistisch, wie Raabs abfällige Kommentare über „die Tür- 
ken“ in der Haremssequenz. 

Hinsichtlich der Verkleidung Eltons gibt es außerdem deutliche Homo- 
logien zur Verkleidung Stefan Raabs in der Eingangssequenz von „Istanbul 
Total“. In dieser ist Elton wie ein Tourist gekleidet und nimmt damit eine 
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vermittelnde „Zwischenstellung zwischen Bühnenakteur und abgebildetem 
Zuschauer“ ein (Bohnsack, 2009). Im Falle der vorliegenden ironischen Ver- 
kleidung jedoch erfüllt sich — wie bei Stefan Raab im Sultansgewand (vgl. 
Kap. 5) — der Aspekt der Distanzierung. Genauer gesagt handelt es sich um 
die Distanzierung vom Ästhetisch-Weiblichen bzw. Sexuell-Anzüglichen. 
Die Anrüchigkeit von beidem gilt es in „Istanbul Total“ zu vermeiden, wie 
sich an zwei weiteren Beispielen erläutern lässt. 

Am dritten Sendetag sind Ersin Akalilar (Geschäftsführer des namhaften 
türkischen Textilunternehmens ,,Mavi Jeans“) sowie der türkische Popsänger 
Mustafa Sandal zu Gast bei „Istanbul Total“. Akalilar präsentiert seine aktu- 
elle Modekollektion, Sandal sein neuestes Musikvideo „Araba“ (Kap. 10). 
Der reizvolle Studioauftritt der Models in kurzen Röcken wird von Elton 
erneut plump ironisierend in (für seine Körperfülle) zu knappen Frauenklei- 
dern abgeschlossen. 


Abbildung 47: Mavi Modeschau (3:05)Abbildung 48: Mavi Modeschau (3:17) 


Im Anschluss an die Modeschau findet das Interview mit Mustafa Sandal 
statt, im Zuge dessen die Videoeinspielung von Mustafa Sandals erotischem 
Musikvideo „Araba“® (Kap. 8) erfolgt. Nach dieser Einspielung werden das 
einzige Mal in der „Istanbul-Total“-Show Frauen mit Kopftüchern gezeigt; 
sie sitzen im Publikum und sind für vier Sekunden im Bild zu sehen. 


68 Das Musikvideo wurde in dieser erotisierten Bildversion speziell für den internationalen 
Markt produziert. Die Bildversion des Videos für den türkischen Markt enthält keine an- 
züglichen Elemente. 
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Abbildung 49: Musikvideo „Araba“ (2004) (6:18)Abbildung 50: Frauen mit 
Kopftuch (6:49) 


Sowohl im Falle der Modeschau als auch im Falle des Musikvideos wird dem 
Ästhetisch-Weiblichen bzw. Sexuell-Anzüglichen bildlich Einhalt geboten: 
im ersten Fall durch die Leistung eines abgebildeten Bildproduzenten (Elton 
in zu knappen Frauenkleidern), im zweiten Fall durch die Leistung der abbil- 
denden Bildproduzentinnen (Einblendung einer Frau mit Kopftuch im Publi- 
kum). 


7.2 Ausblendung von Islam und islamistischem 
Fundamentalismus 


In Analogie zu Eltons bauchfreiem Auftritt kann das Zeigen der Frauen mit 
Kopftüchern (Abbildung 50) ebenso im Sinne einer Distanzierung verstanden 
werden. Bemerkenswert ist jedenfalls, dass diese Einstellung gewählt wurde, 
obwohl Kopftücher dem Common-Sense nach im Westen oft mit konservati- 
veren Formen des Islam und religiösem Fundamentalismus attribuiert wer- 
den. Vermutlich aus diesem Grunde werden weder Kopftücher noch der 
Islam zu irgendeinem anderen Zeitpunkt der Sendung „Istanbul Total“ ge- 
zeigt bzw. thematisiert. Es entsteht sogar eher der Eindruck als solle jegliche 
Verbindung zwischen der Fernsehsendung mit dem Islam vermieden werden. 
Wie wir uns in Erinnerung rufen können, findet sich ein Hinweis für diese 
Ausklammerung schon in der Eingangspassage (Kap. 5), als der Moderator 
Stefan Raab die Hagia Sofia als „eine der ältesten Kirchen“ bezeichnet; 
wohlwissend (so erklärt sich Raab zumindest selbst nach der Werbepause), 
dass jeder „Klugscheißer“ natürlich wisse, dass es sich dabei früher um eine 
Moschee gehandelt habe. 
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Im Kontrast dazu werden im ZDF-Reisevideo „Reiselust Istanbul“, das aus 
demselben Jahr (2004) wie „Istanbul Total“ stammt, in den Straßen der Stadt 
sowohl Frauen mit Kopftüchern gezeigt als auch die Türkei vom Kommenta- 
tor als „islamisches Land“ ausgewiesen (Reiselust Istanbul, 21:45). Im ame- 
rikanischen Reisevideo „Travelers Istanbul“ (1997) werden die ausländischen 
Vorurteile gegenüber Fundamentalismus offen angesprochen (Travelers Is- 
tanbul, 15:05) und von einer türkischen Reiseleiterin sogar eine Stellung- 
nahme zum Islam abgegeben (11:00). Dies ist ebenso im Dumont-Reisevideo 
„Istanbul On Tour“ (1997) der Fall, wo sowohl von islamischem Fundamen- 
talismus berichtet wird als auch Frauen mit Kopftuch auf Istanbuls Straßen 
gezeigt werden. 

Dass Islam und Fundamentalismus normalerweise Themen sind, die von 
Stefan Raab sehr wohl behandelt werden, zeigt sich an einer „TV-Total“- 
Folge, die eine Woche vor „Istanbul Total“ gesendet wurde. Darin kommen- 
tiert Raab eine Zeitungsmeldung über das Kinderfernsehen in Afghanistan 
und konstruiert ironisierend einen islamistisch-fundamentalistischen Hinter- 
grund dazu. Die folgende Abbildung zeigt Raab bei der Erläuterung, wie 
Kinder (seinen Ausführungen nach) in Afghanistan im Rahmen der Sendung 
„Sesamstraße“ das Zählen erlernen würden (Abbildung 51): „Eins, zwei, drei, 
vier, fünf, nachladen“. Weitere Wortspiele präsentiert Raab zu anderen 
„deutschen TV-Sendungen“, die in Afghanistan angeblich „nachgemacht 
wurden“: „Der Mulla von Tölz“, „Guantanamo Bay-Watch“ oder die Talk- 
show „Bärbel Schläfer“. Auch in diesen Formulierungen zeigen sich die 
Bezüge zum Islam sowie zum islamischen Fundamentalismus und Terroris- 
mus unverkennbar. „Mullas“ sind religiöse muslimische Führer, „Guan- 
tanamo Bay“ bezeichnet das Strafgefangenenlager für mutmaßliche Al- 
Qaida-Mitglieder auf Kuba. Als ,,Schlafer“ wiederum wurden nach den 
Anschlägen vom 11. September 2001 jene radikalisierten islamistischen 
Terroristen bezeichnet, die unerkannt in westlichen Gesellschaften leben, bis 
sie eines Tages unerwartet ein Attentat verüben. 
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„vier“ „fünf“ „nachladen 


Abbildung 51: TV Total, 4. Mai 04 (0:24-0:29) 


In Anbetracht dieser Vergleichsbeispiele tritt abschließend die offenkundige 
Vermeidungstendenz der Sendung „Istanbul Total“ noch deutlicher hervor. 
Die Religion des Islam soll während der Sendung nicht thematisiert werden. 
Damit kann die kurze Einblendung zweier Frauen mit Kopftuch aus dem 
Publikum (Abbildung 50) als Kompromissbildung verstanden werden. Diese 
erfüllen vor allem die Funktion die Darbietung erotischer Tanzszenen im 
Ausschnitt des Musikvideos „Araba“ einzudämmen. Zugleich lässt sich 
dadurch aber auch abermals eine stereotype Distanzierung vom Türkischen 
vornehmen. Die Kopftücher können in diesem Sinne als Symbole der gesell- 
schaftlichen Rückständigkeit verstanden werden, durch welche sich (nach 
Auffassung der Sendungsmacher) die türkische Gesellschaft auszeichne. 


7.3 Inszenierung und Vermeidung von Gewalt und Gefahr 


In ähnlicher Weise wie Islam und Fundamentalismus gilt es in „Istanbul 
Total“ die Themen Gewalt und Gefahr zu vermeiden. Erste Hinweise darauf 
finden sich ebenfalls bereits in der Eingangspassage, wo das „Stereotyp der 
Türken als kleine Gauner und Schwindler“ (Bohnsack, 2009) — in Abgren- 
zung zu Schwerverbrechern — entwickelt wird. Beschrieben und diskutiert 
werden alltägliche Delikte, bei denen niemand größeren Schaden nimmt. 
Beim Handeln am Bazar hat man als Kunde vielleicht das Nachsehen gegen- 
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über den angeblichen betrügerischen Praktiken der Türken, ein anderes Mal 
profitiert man wiederum davon (etwa beim Erwerb billiger Fälschungen oder 
Raubkopien von Markenprodukten)”. 

Echte Gewalt und Gefahr wird in „Istanbul Total“ nicht zum Thema ge- 
macht. Historisch mag sie zwar früher vom osmanischen Sultan ausgegangen 
sein. Dessen Begehren konnte laut Raab („Haremsequenz“) aber zum Glück 
militärisch Einhalt geboten werden: „Hat er mal gesagt, passt mal auf, Freun- 
de, ich komm mal nach Wien. Ich bring ein paar Leute mit. Hat er aber die 
Rechnung ohne den Wirt gemacht. In Wien war nämlich Schluss.“ 

Dass Stefan Raab selbst am ersten Sendetag so tut, also ob er ein osmani- 
scher Sultan wäre (etwa durch seine folkloristische Verkleidung mit Umhang 
und Turban), erscheint paradox, ist hier aber als ironische Brechung und 
Distanzierung zu verstehen (vgl. Bohnsack, 2009). Das Motto scheint zu 
lauten: „Ich kleide mich wie die einstig unbarmherzigen Sultane und erkläre 
selbst herrschaftliche Ansprüche damit, distanziere mich aber zugleich von 
diesen Herrschern, weil mir sie und ihr Erbe nicht ganz geheuer sind.“ 

Effektives Schwerverbrechen und Lebensgefahr sind tatsächlich Hori- 
zonte, die im Dumont-Reisevideo „On Tour“ (36:00: Auf der Straße herrscht 
Lebensgefahr, 39:00: Prostitution und Kriminalität im Bezirk Aksaray), so- 
wie in ZDF-Reisevideo „Reiselust Istanbul“ (Terroranschläge von Istanbul) 
aufgeworfen werden. In „Istanbul Total“ werden solche Bezüge aber nicht 
hergestellt. Dass der Eindruck von Gefahr in „Istanbul Total“ auf ironisieren- 
de Weise effektiv vermieden werden soll, dokumentiert sich bildlich aber in 
einer modifizierten Version der Intro-Sequenz „Raab in Gefahr“, die übli- 
cherweise Bestandteil jeder Stefan-Raab-Sendung ist. Wie auf den folgenden 
Abbildungen erkennbar, wurde in dieser Intro-Sequenz das brennende Wort 
„Gefahr“ vor schlammigem Hintergrund einfach durch das Wort „Istanbul“ 
ersetzt, das mit Stefan Raabs Turban ins Bild fliegt. Gleichzeitig wechseln 
die zuvor harten, rhythmischen Gitarrenriffs zu einer verspielten orientali- 
schen Melodie über. An die Stelle echter, realer Gewalt und Gefahr (die etwa 
durch fundamentalistische Attentate entstehen könnte) tritt die Veralberung 
von Gefahr, was letztlich der Entängstigung dient. 


69 Diese Form des charmanten Betrugs wird auch im Vergleichsmaterial des Reisevideos 
„Travelers“ erwähnt, als die Moderatoren von einem Eisverkäufer zu wenig Retourgeld be- 
kommen („Eisverkäufersequenz“, 23:40). 
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Abbildung 52: Raab in Gefahr (TV Total) 


Abbildung 53: Raab in Istanbul (Istanbul Total) 


7.4 Coda: Kontextanalyse der Produktionsbedingungen von 
„Istanbul Total“ 


Zum Ende des Kapitels möchte ich mich am Beispiel von „TV Total“ und 
„Istanbul Total“ noch der Frage der Produktionsverhältnisse zuwenden. Da- 
mit werfe ich abschließend das Licht auf den (ökonomischen) Entstehungs- 
kontext der Fernsehshow und jene spezifischen Erfahrungsräume, die diese 
letztlich hervorbringen. Prägnanter formuliert geht es somit um die Frage wie 
ist das Milieu derer beschaffen ist, die die Fernsehsendung „Istanbul Total“ 
produziert haben und damit Geld verdienen. 

Bohnsack (2009) macht hinsichtlich der Fernsehsendung „Istanbul Total“ 
auf eine besondere Rahmenkomponente aufmerksam: den „parasitären Auf- 
merksamkeitsgewinne“. Im Wesentlichen bestreiten Late-Night-Shows wie 
etwa „TV Total“ bzw. „Istanbul Total“ ihr Programm nicht durch aufwendige 
Eigenproduktionen, sondern über weite Strecken hinweg durch das ironisie- 
rende Kommentieren bereits bestehender medialer Programmangebote bzw. 
Großereignisse. Das Prinzip des „parasitären Aufmerksamkeitsgewinns“ 
dokumentiert sich auch auf betriebswirtschaftlicher Ebene, wie anhand der 
Gäste deutlich wird, die Stefan Raab in sein Istanbul-Total-Studio am 
Bosporus zum Interview einlädt: seien es der Songcontest-Kandidat Max 
Mutzke, Nina Öger (die Geschäftsführerin von Öger-Tours), der türkische 
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Popsänger Mustafa Sandal, der Fußballtrainer Christoph Daum oder andere — 
sie alle erfüllen (unabhängig davon, was sie zu sagen haben) die unmittelbare 
Funktion, den Marken- und Werbewert des bzw. der Einladenden (hier: den 
Marken- und Werbewert des Moderators Stefan Raab sowie seiner Sendung 
„Istanbul Total“) zu erhöhen. Doch dieser Effekt ist sogar wechselseitig. 
Durch das Interview in einer bekannten Sendung (wie „Istanbul Total“) er- 
höht sich im Gegenzug auch der Marken- und Werbewert der Eingeladenen. 

Auf Basis dieser Beobachtung lassen sich Late-Night-Shows auch als 
Systeme des „reziproken parasitären Aufmerksamkeitsgewinns“ verstehen. 
Durch ihre Auftritte in der TV-Show werden für alle Beteiligten (die Einla- 
denden sowie die Eingeladenen) eindeutige Synergien (Zugewinne an (Mar- 
ken-)Bekanntheit, Marktanteilen und damit Einfluss und Vermögen) geschaf- 
fen. Die früher erwähnte Monostrukturierung der Sendung durch den Mode- 
rator ermöglicht es Stefan Raab den Interviewpartner/inne/n auf ökono- 
mischstem Wege Raum zur Selbstpräsentation einzuräumen, sei es, um dem 
Fernsehpublikum ihr aktuelles Musikvideo, ihre neue CD oder ihre neue 
Modekollektion vorzustellen bzw. schlicht für ihre Marke und ihre Firma zu 
werben. Flusser (1997, S. 105) spricht in diesem Zusammenhang auch vom 
„ ethischen‘ Missbrauch“ der Zusehenden durch das Fernsehen: „Gegenwär- 
tig wird das Fernsehen verwendet, um dem Empfänger seiner Botschaften zu 
einem spezifischen Verhalten zu führen, nämlich zum Verbrauch jener physi- 
schen und geistigen Güter, an denen die Besitzer des Fernsehsystems interes- 
siert sind.“ (Flusser, 1997, S. 105) 

Stefan Raab und seine Gäste können somit als Marken betrachtet werden, 
die sich gegenseitig durch die gemeinsame Performance in einer Fernseh- 
show Popularitätsgewinne, Reichweite und Marktanteile verschaffen. Dieser 
vorläufige Befund lässt sich durch weiterführende Betrachtung der Unter- 
nehmensverflechtungen der betrachteten Fernsehshows erhärten. Die Sen- 
dungen „Istanbul Total“ und „TV Total“ sind beide Marken der Produktions- 
firmen „Raab TV“ und „Brainpool TV GmbH“. Eigentümer der Firma „Raab 
TV“ waren zum Zeitpunkt der Sendungen zu 50% Stefan Raab selbst und zu 
50% die „Brainpool TV GmbH“.’ Zugleich war die „Brainpool TV GmbH“ 
ihrerseits ein 100%iges Tochterunternehmen der „Viva Media GmbH“.’' Die 
„Viva Media GmbH“ wiederum war über eine 100%ige Tochter, die „Viva 
Fernsehen GmbH“,die Produzentin des Musiksenders Viva, auf dem das 
Musikvideo „Araba“ (2004) von Mustafa Sandal ausgestrahlt und promotet 
wurde. Im August 2004 übernahm das amerikanische Konkurrenzunterneh- 
men ,,Viacom“ die „Viva Media GmbH“ zu 98%. Zu „Viacom“ gehört auch 


70 Mit 31. Dezember 2008 wurde die „Brainpool TV GmbH“ 100%ige Eigentümerin von 
„Raab TV“. 

71 Mit 1. Jänner 2007 kam es zum Management-Buy-Out, wodurch die „Brainpool TV 
GmbH“ heute wieder ein eigenständiges Unternehmen ist. 


151 


der weltweit bekannteste Musiksender „MTV“. Durch den Kauf von Viva 
konnte „Viacom“ damit seine angestrebte weltweite Monopolstellung für 
Musiksender weiter ausbauen. 

Damit wirkten sich die Eurovision-Songcontest-Präsentation von Max 
Mutzke sowie die Ausstrahlung des Musikvideos ,,Araba“ von Mustafa San- 
dal in der TV-Show „Istanbul Total“ nicht nur unmittelbar positiv auf die 
Produktionsfirma dieser Sendung („Raab TV“) aus, sondern in weiterer Folge 
auch auf die anteilsmäßig beteiligten Mutterunternehmen im Hintergrund 
(„Brainpool TV GmbH“, „Viva Media“, „Viacom“ etc.). Des Weiteren profi- 
tieren der ausstrahlende Fernsehsender ProSieben, der Musikkonzern Edel 
Music” (Vertrieb der Tonträger von Max Mutzke), der Musikkonzern Poly- 
dor” (Vertrieb der Tonträger von Mustafa Sandal), die Europäische Rund- 
funkunion (als Ausrichterin des „Eurovision Songcontest“) sowie deren 
Sponsoren, die Werbeunternehmen sowie die Musikindustrie etc. Zusammen- 
fassend repräsentieren die in der Fernsehshow „Istanbul Total“ auftretenden 
Gäste somit auf unterschiedlichen Ebenen Shareholderinteressen. Durch die 
Unterhaltungssendung „Istanbul Total“ entstehen nachhaltige finanzielle 
Multiplikatoreffekte, in welche sowohl die Protagonist/inn/en der Fernsehs- 
how als auch die eingeladenen Gäste eingebunden sind. 

Was die Protagonist/inn/en angeht, so wird „Istanbul Total“ im Kern von 
vier Personen getragen, denen in der Show spezifische mediale Funktionen 
zugeordnet sind: Stefan Raab ist der Moderator, Elton sein Assistent, Max 
der Gesangsstar und die Deutsch-Türkin Gülcan schafft die Verbindung zur 
türkischen Sprache und Kultur. Die Showauftritte sind für alle Beteiligten 
unmittelbar marketingwirksam — dies ist nicht nur für sie persönlich vorteil- 
haft, sondern leistet auch einen wichtigen Marketingbeitrag für deren eigene 
Medienproduktionen: So hat Elton (zum Ausstrahlungszeitpunkt von „Istan- 
bul Total“) etwa selbst eine Show namens „Elton TV“, die auf dem deut- 
schen Musiksender Viva regelmäßig ausgestrahlt wird. Gülcan wiederum 
moderiert bei Viva die Music-News. Um Max Mutzke als Marke durch den 
Hebel seiner Eurovision-Songcontest-Teilnahme zu mehr Popularität und 
Reichweite zu verhelfen, wird auf Viva täglich sein Musikvideo gezeigt. 
Vivas Einschaltquote erhöht sich proportional zum Erfolg von „TV Total“. 
Dies ist in Anbetracht der Unternehmensverschachtelungen ein mehrfacher 
Erfolg. Dem ausstrahlenden Privat-TV-Sender ProSieben gelingt es über den 
Umweg von Stefan Raabs „Istanbul Total“ sogar einen Zugang zur European 
Broadcasting Union (EBU), dem Veranstalter des Songontests, zu erhalten. 


72 Die Edel-AG ist in der Musikindustrie eines der letzten und größten noch unabhängigen 
Musikunternehmen Europas (sog. „Independent Label“). 

73 Polydor gehört zu Universal Music, einem der fünf größten Musikkonzerne der Welt (sog. 
„Major Label“). 
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Zum Zeitpunkt der Sendung „Istanbul Total“ waren von deutscher Seite in 
der EBU nur die öffentlich-rechtlichen Sender (ARD und ZDF) vertreten. 

Zusammenfassend dokumentiert sich anhand des Beispiels „Istanbul To- 
tal“, dass jede Person, jede Maßnahme, jedes Medienevent, welche/s in dieser 
Sendung vorkommt, eine unmittelbare multiplikative und extensive Wirkung 
auf sich selbst sowie auf die mit ihr in Verbindung stehenden Personen, Sen- 
dungen, Medienereignisse und Unternehmen ausübt. Die Hauptmarke „TV 
Total“, von der „Istanbul Total“ ein Ableger ist, macht, wie der Name der 
Sendung schon sagt, das Fernsehen selbst, also mediale Produkte zum Ge- 
genstand (eines medialen Produkts). Sparsamer, mithin ökonomischer geht es 
kaum. Die Bezugnahme auf bereits erfolgreich Produziertes erlaubt eine 
äußerst schlanke Produktion und erzeugt eine Menge wirtschaftlich er- 
wünschter (ökonomischer) Synergieeffekte. Das rechtfertigt sogar die kurz- 
zeitige Übersiedlung der Produktion nach Istanbul. Denn indem „TV Total“ 
dem Songcontest massive PR zuteilwerden lässt, versorgt es sich selbst mit 
Inhalt und stärkt dabei noch seine eigene Marktposition als innovatives und 
lebensnahes Unterhaltungsmedium. 

Im Kontext der ökonomischen Verbindungen, die im Zusammenhang mit 
der Fernsehsendung „Istanbul Total“ und ihren Protagonist/inn/en stehen, 
lassen sich die übergeordneten Orientierungsrahmen der Show besser verste- 
hen. Der kommerzielle Hintergrund der Show ist durch den Sendungshabitus 
der ständigen Ironisierung und Distanzierung gut kaschiert. Mithilfe der Me- 
thodentriangulation von Videointerpretation und Kontextanalyse (u.a. Re- 
cherche der Unternehmensbeteiligungen) konnte jedoch als für die Sendung 
„Istanbul Total“ strukturell bedeutsamer Orientierungsrahmen rekonstruiert 
werden. 
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Abbildung 54: Schallplattencover der Single „Araba“ (1996), Sony Music 
France; Quelle: http://wikibit.net/album/Mustafa-Sandal/Araba 


Die Anfang/Mitte des 20. Jhdts. anlaufende Produktion von individuell ge- 
stalteten Schallplattencovers kann als medienhistorischer Beleg dafür ver- 
standen werden, dass der Ton immer schon nach einem Bild verlangte. Darin 
ist auch die prinzipielle Verwandtschaft von Schallplattencovers und Mu- 
sikvideos begründet. In Abb. 54 ist das Cover der Erfolgssingle „Araba“ des 
türkischen Popsängers Mustafa Sandal zu sehen. Der Musiker fixiert unver- 
hohlen den Blick der Bildbetrachter/innen und streckt ihnen seine gespreizte 
Hand entgegen. In Kombination mit dem gesenkten Kopf und seinen gespit- 
zen Lippen wird der Sänger als proaktiver Verführer porträtiert. Verführung 
spielt auch in der Neuauflage des Covers für den internationalen Markt (Abb. 
68) eine Rolle. Allerdings ist die Verführung dabei stärker auf die bloße 
Erscheinung Mustafa Sandals fokussiert, was sich in seinem gesenkten Blick 
und der reduzierten Gestik Sandals zeigt. In Analogie dokumentieren sich 
diese beiden Spielformen der Verführung auch in den entsprechenden Mu- 
sikvideos von Araba. 
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8 Zur Videointerpretation von Musikvideos 


Dieses und die beiden nachfolgenden Kapitel sind auf Musikvideos als audi- 
ovisuelle Produkte der Massenkommunikation gerichtet. Die jährlichen Me- 
dienberichte der Rundfunkanstalten (z. B. MPFS, 2012) legen Zeugnis davon 
ab, dass Jugendliche und Migrant/inn/en zu enthusiastischsten Anhä- 
nger/inne/n von Musikvideos gehören. Diese Gruppen lassen sich in der 
Terminologie des Medienpsychologen Vitouch (2007) auch als „Vielse- 
her/innen“ bezeichnen. Die starke Verbindung von Mediennutzung und All- 
tagspraxis verleiht Musikvideos die Möglichkeit die biografischen Ereignisse 
und Prozesse ihrer Rezipient/inn/en zu moderieren und für sie nieder- 
schwellige Identifikations- und Entwicklungsräume zu eröffnen. Unter Be- 
rücksichtigung dieser medialen Dimensionen übersteigen Musikvideos damit 
bei weitem die ihnen oft verkürzt zugeschriebene Funktionalität einer bloßen 
visuellen Unterstützung oder Begleitung von Musik. 

Während die historischen Wurzeln wechselseitiger kompositorischer 
Steigerungen von Film und Musik mehr als ein Jahrhundert bis zu den An- 
fängen des Kinos zurückverfolgt werden können, markieren die Einführung 
von im Fernsehen übertragenen Musiksendungen in den 1970ern und — noch 
bedeutsamer — die in den frühen 1980ern stattfindende Etablierung dezidier- 
ter Musik-Fernsehsender (z. B. MTV) wichtige Meilensteine in der Massen- 
kommerzialisierung von Musikvideos als eigenes Genre (Austerlitz, 2008). 
Von diesem Punkt an wurde die Produktion von Musikvideos zum wesentli- 
chen und unverzichtbaren Bestandteil der Marketing-Mixstrategien von Mu- 
sikfirmen, um maximale Zuhörerschaften zu erreichen und Lieder an ein 
breites Publikum zu verkaufen. Die Wirksamkeit dieser Strategie wird vom 
jährlichen Bericht der International Federation of the Phonographic Industry 
(IFPI) unterstützt. Laut IFPI wurden die Musikvideos des bisher ein- 
schaltequotenstärksten Popsängers Justin Bieber „mehr als zwei Milliarden 
mal angesehen“ (IFPI, 2012, S. 13). Ende 2012 stellte der koreanische Sänger 
Psy einen neuen Rekord für ein einzelnes Musikvideo auf. Sein internationa- 
ler Hit „Gangnam Style“ wurde über eine Milliarde Mal angesehen™ (MTV, 
2012). Gemäß der deutschen JIM-Studie”, einer jährlichen Umfrage zur 
Mediennutzung von Jugendlichen schauen 74% der 12- bis 19-Jährigen 
regelmäßig Musikvideos an (MPFS, 2012). Eine zweite repräsentative Stu- 
die”, die 2007 von den deutschen Rundfunkunternehmen ARD und ZDF 


74 Zum 15. April 2013 haben laut Youtube bereits über 1,5 Milliarden Abrufe des Musikvi- 
deos „Gangnam Style“ stattgefunden. Link zum Video: http://www.youtube.com/ 
watch?v=9bZkp7q19f0 

75 n=1201 Befragte 

76 n=3010 Befragte mit Migrationshintergrund, älter als 14 Jahre 
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durchgeführt wurde, zeigt, dass Musikvideos für 77 % der in Deutschland 
lebenden Migrant/inn/en im Alter zwischen 14 und 29 Jahren zu den belieb- 
testen Fernsehübertragungen gehören (ARD/ZDF, 2007, S.36; Walter, 
Schlinker & Fischer, 2007, S. 447). Wenn Menschen bestimmte Medien 
häufig in Anspruch nehmen, impliziert dies, dass diese Medien für ihre Nut- 
zer/innen von großer Bedeutung sind. Häufige Mediennutzung muss prak- 
tisch in alltägliche Lebensroutinen integriert werden. Somit sind Medien 
nicht nur Teil der menschlichen Kommunikation, sondern selbst als eigen- 
ständige Kommunikationsmittel anzusehen. Die Idee der Kommunikation 
durch Musikvideos trägt der Tatsache Rechnung, dass Menschen ihre alltäg- 
lichen Erfahrungen, Träume oder Zukunftserwartungen artikulieren können, 
indem sie auf spezifische Videos Bezug nehmen, die von ihren Gemein- 
schaften geteilt werden und leicht zugänglich sind. Musikvideos stellen dabei 
insofern besondere Bedeutungsträger dar, als sie sich von ihrem ursprüngli- 
chen Vermittlungsmedium — dem Fernsehen — ablösen und mit scheinbarer 
Leichtigkeit den Übergang ins Internet vollziehen konnten.” Dieser Über- 
gang ist anderen Medienformen, etwa Fernsehshows oder Nachrichtensen- 
dungen, bislang nicht in entsprechender Weise gelungen. 

In ihrer Funktion als Kommunikationsmittel sind Musikvideos eng mit 
der persönlichen Entwicklung ihrer Benutzer/innen verbunden. Von daher 
überrascht es wenig, dass im Rahmen von Musikvideos häufig eine inhaltli- 
che Auseinandersetzung mit Entwicklungsherausforderungen stattfindet. 
Eines der relevantesten — und damit auch eines der in Musikvideos am häu- 
figsten dargestellten — Themen für Jugend- und Migrationsgruppen ist das 
Auf und Ab romantischer Beziehungen. Romantische Beziehungen können 
der Grund sein, in ein anderes Land zu ziehen, eine fremde Sprache zu ler- 
nen, neue Bücher zu lesen, den Freundeskreis zu verändern etc. Aus einer 
entwicklungsorientierten Perspektive spielen romantische Beziehungen daher 
eine signifikante Rolle im Auftreten von biografischen Brüchen und deren 
„Reparatur“ bzw. psychischer Heilung. Damit Musikvideos erfolgreich sind, 
müssen sie die persönliche Erfahrung dieser Spannungszustände aktiv be- 
wirtschaften bzw. kultivieren. 

Für die nachfolgende empirische Betrachtung habe ich zwei Musikvideos 
ausgewählt, die auf der Basis desselben Liebesliedes produziert wurden: 
„Araba“ war 1996 einer der größten Erfolge des türkischen Popsängers Mus- 
tafa Sandal. 2004 wurde das Lied für den internationalen Markt neu verfilmt. 
Welche Arten von biografischen Brüchen und psychischen Heilungsformen 
werden in den beiden Musikvideo-Versionen visuell dargestellt? Zur Beant- 


77 Laut MPFS (2012) ist Fernsehen nicht länger das alleinige Medium zur Veröffentlichung 
von Musikvideos. Obwohl zwei Drittel der Musikvideos noch immer online und im Fern- 
sehen angesehen werden, wird mittlerweile ein Drittel ausschließlich im Internet ange- 
schaut. 
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wortung dieser Forschungsfrage werden zunächst einige Überlegungen zur 
begrifflichen Bezeichnung des Fallmaterials präsentiert, bevor die visuelle 
Einführung in das Material mit Hilfe von Videotranskripten erfolgt. Im Zu- 
sammenhang mit der Erläuterung der zentralen methodologischen Konzepte 
und Begrifflichkeiten wird dann ein Überblick über das Verfahren der Video- 
interpretation nach der dokumentarischen Methode, mit Schwerpunktsetzung 
auf die Rekonstruktion von Farben und Farbkontrasten, gegeben. Abschlie- 
Bend erfolgt die Zusammenfassung und Diskussion der Ergebnisse der empi- 
rischen Videointerpretationen hinsichtlich biografischer Brüche und deren 
psychischen Heilungsformen. 


8.1 Zwei Versionen von „Araba“ 


Zur komparativen Analyse zweier Videoversionen eines Popsongs ist es 
zuerst erforderlich, diese Versionen zu benennen, um eine begriffliche Be- 
zugnahme zu ermöglichen. Nachdem die beiden Musikvideos jeweils im 
türkischen und im deutschen Musikfernsehen ausgestrahlt wurden, wäre es 
möglich, sie einfach „das türkische“ und „das deutsche“ Video zu nennen. 
Mit dieser Idee wären allerdings mehrere Nachteile verbunden. Erstens sind 
„Türkisch“ und „Deutsch“ sehr vielschichtige und weitreichende Konzepte, 
die eine große Bandbreite an Aspekten in sich bergen: In der Umgangsspra- 
che können ,,das Türkische“ und „das Deutsche“ beispielsweise auf Nation, 
Kultur, Sprache, Mentalität, Moral u. a. verweisen. Zweitens unterscheiden 
die Bezeichnungen „Türkisch“ und „Deutsch“ nicht zwischen Produ- 
zent/inn/en, Schauspieler/inne/n und Videoszenen. So ist zum Beispiel in 
beiden Fällen des Videomaterials der Sänger (Mustafa Sandal) türkischer 
Herkunft (bezogen auf die Staatsangehörigkeit bei seiner Geburt) und singt 
auch in türkischer Sprache. Die Produzenten der Videos (Sony Music France 
und Polydor) sind hingegen international operierende Produktionsgemein- 
schaften.” Eine weitere Möglichkeit der Benennung wäre damit: „die Sony 
Version“ und „die Polydor Version“. In diesem Zusammenhang könnten die 
beiden Videoversionen auch durch die Einbeziehung des Jahres ihrer Veröf- 
fentlichung unterschieden werden. Denn die Sony Version wurde 1996 pro- 
duziert, die Polydor Version 2004. Die Verwendung von Titeln wie „Sony 
1996“ und „Polydor 2004“ für die zwei Videoversionen könnte möglicher- 


78 Die erste Version von ,,Araba” wurde 1996 von Sony Music France, die zweite 2004 von 
Polydor Germany produziert. Sony Music France gehört zu Sony Music Entertainment, 
Polydor zur Universal Music Group. Beide Unternehmen haben ihren Hauptsitz in New 
York City, USA. 
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weise aber zu abstrakt erscheinen und den Lesefluss stören. Abgesehen davon 
würde die Unterscheidung anhand von Jahreszahlen und Firmennamen mög- 
licherweise auch vom eigentlichen Gehalt der Gegenüberstellung ablenken. 
Dasselbe gilt für die Option, die zwei Videos als „die erste“ und „die zweite“ 
oder ,,die alte“ und „die neue“ Version zu bezeichnen. Auch derartige Be- 
zeichnungen wären insofern irreführend, als sie eine bestimmte Reihenfolge 
des Materials implizieren und damit vom inhaltlichen Fokus der Untersu- 
chung ablenken würden. Bei dem Versuch, einen Mittelweg zwischen be- 
grifflich implizit vorbelasteten oder voreingenommenen Bezeichnungen, aber 
auch zu allgemeingültigen oder vagen Benennungen zu finden, möchte ich 
vorschlagen die zwei Videos in Bezug auf die Märkte zu unterscheiden, für 
welche ihre Veröffentlichungen bestimmt waren. Märkte sind Orte, an denen 
verschiedene Parteien Austausch treiben. Um Absatz zu generieren, müssen 
Musikgesellschaften marktnah produzieren und ein praktisches Gespür dafür 
entwickeln, was das Publikum kaufen wird. Daher fokussiert der Begriff 
„Markt“ im soziokulturellen Sinn die Beziehungen zwischen Produ- 
zent/inn/en und Konsument/inn/en von Musikvideos. Zudem ist das Konzept 
des Marktes ein dynamisches, welches in einem kultur- und sozialgeschicht- 
lichen Sinne vergangene Erfahrungen und Zukunftserwartungen von Markt- 
beteiligten bestimmter Medienumfelder mit einschließt. Dieser Ansatz passt 
damit gut zum medientheoretischen Charakter dieser Arbeit. 

Zum Abschluss dieser Diskussion möchte ich konstatieren, dass jede Me- 
thode zur Betitelung der Musikvideos Vor- und Nachteile hat. Dennoch gibt 
es Begrifflichkeiten, die zum Verständnis des Fallmaterials beitragen können, 
noch bevor dieses interpretiert wird. Die anfänglichen Labels „Türkisch“ und 
„Deutsch“ oder ,,Araba 1996“ und „Araba 2004“ wurden aufgrund der ihnen 
anhaftenden impliziten Polarisierung verworfen. Derartige Konzepte neigen 
dazu, ein isoliertes Verständnis der beiden Videos zu begünstigen. Dabei sind 
diese alles andere als unabhängig voneinander. Wenngleich sich das zweite 
Video optisch stark vom ersten unterscheidet, so konnte es dennoch nur in 
Referenz zum ersten produziert werden. Indem ich die zwei Videos letzten 
Endes als „die Version für den internationalen Markt“ und „die Version für 
den türkischen Markt“ bezeichne, liegt nun die Betonung ausdrücklich auf 
den Gemeinsamkeiten und Dynamiken der beiden Versionen. Wenngleich 
das erste Video aus einer türkischen Sphäre (was auch immer diese konkret 
einschließt) hervorgegangen sein mag, ist das zweite Video nicht einfach nur 
als „internationaler“, vollkommen von der türkischen Version unabhängiger 
Gegenpart anzusehen. Mit Sloterdijk (2004) in Bezug auf Latour (2001) kann 
die zweite Version vielmehr als „Entfaltung“ bzw. „Artikulation“ der ersten 
angesehen werden. Acht Jahre später produziert, schließt sie ein weiteres 
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Publikum mit ein, das sich sowohl aus türkischstämmigen als auch aus Zuse- 
henden anderer Länder zusammensetzen kann.” 


8.2 Die medialen Eigenschaften von Musikvideos 


Dieses Kapitel bedient sich der empirischen Instrumente, die Bohnsack 
(2009) im Rahmen der Bild- und Videointerpretation nach der dokumentari- 
schen Methode entwickelt hat, und erweitert diese entsprechend der besonde- 
ren Materialerfordernisse des Mediums „Musikvideo“. Dabei ist das Konzept 
einer medientheoretisch inspirierten Kulturpsychologie, welches von Slune- 
cko (2008) eingeführt wurde, von signifikanter Bedeutung. Diese psychologi- 
sche Position, die mit der psychologischen Tradition bricht, menschliches 
Erleben und Verhalten unabhängig von Kultur und Medien zu beforschen, 
wurde von Slunecko, Przyborski und Ruck theoretisch weiter ausgearbeitet 
(Przyborski & Slunecko, 2009, 2011; Ruck & Slunecko, 2008; Slune- 
cko & Przyborski, 2009). Psycholog/inn/en sollten demnach Kulturen und 
Medien als und mit den Menschen stets verbundene Agenten (an)erkennen. 
Im Hinblick auf die Forschungspraxis bedeutet dies, dass neue Wege gefun- 
den und Instrumente entwickelt werden müssen, um die nun erkennbar ge- 
wordenen Mensch-Kulturen-Medien-Phänomene empirisch zu erfassen.” In 
dieser Hinsicht nehme ich hier somit neben einer methodologischen auch 
eine metatheoretische Position ein, in welcher der gegenseitigen Beeinflus- 
sung von Menschen, Kulturen und Medien eine besondere Aufmerksamkeit 
geschenkt wird. 

Einer von Bohnsacks Hauptbeiträgen zur qualitativen Sozialforschung 
kann darin gesehen werden, dass er das Feld der Kunsttheorie (Imdahl, 1996; 
Panofsky, 2006) für die empirische Wissenschaft zugänglich gemacht hat. 
Des Weiteren ist es ihm gelungen, etablierte Konzepte der Kunsttheorie — 
z. B. Panofskys „Ikonografie und Ikonologie“ (2006) und Imdahls „Ikonik“ 
(1996) — als empirische Instrumente der qualitativen Bild- und Videointer- 
pretation nutzbar zu machen. Diesem Beispiel folgend, bin ich selbst im 
Rahmen der weiterführenden Auseinandersetzung mit Kunstliteratur auf die 
Arbeiten von Itten (2000, 2010) zum Thema Farben gestoßen. Paradoxer- 
weise sind Farben ein komplexes Untersuchungsgebiet, obwohl sie nach der 


79 Diese Betrachtungsweise lässt sich mit einer Beobachtung verbinden, die ich machte, als 
ich beide Videoversionen Personen türkischer Herkunft zeigte. Ich hatte angenommen, dass 
Türken die „türkische“ Version bevorzugen würden. Es zeigte sich jedoch, dass ihnen die 
„internationale“ Version besser gefiel. 

80 Dieser Gedanke wird auch in Latours (2001) Konzept „Parlament der Dinge” herausgear- 
beitet. 
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Wahrnehmung einer/s jeden unmittelbar erfasst werden können. Ittens Über- 
legungen nach existieren Farben nicht in isolierter Weise, sondern ändern 
ihre Beschaffenheit stets in Bezug zu anderen Farben, die sie umgeben bzw. 
ihnen vorausgehen oder nachfolgen. In Anbetracht dieser spezifischen Phä- 
nomenologie schlägt Itten (2000, 2010) vor, sich von der isolierten Interpre- 
tation von Farben hin zu einer Interpretation von Farbkontrasten zu bewegen. 
Dieses Konzept von miteinander in Beziehung stehenden Farben ist sowohl 
mit der zuvor skizzierten theoretischen Orientierung an einer medientheoreti- 
schen Kulturpsychologie als auch mit der Methodologie der dokumentari- 
schen Methode gut zu vereinbaren. Nach Aussage von Bohnsack (2009) 
verdient die Untersuchung sinngenetischer Relationierungen bei der Erfor- 
schung von Film und Video besondere Beachtung: Während die Interpreta- 
tion von Fotogrammen - als (repräsentative) Standbilder von Einstellungen — 
auf die Beziehungen der Bedeutungsebenen innerhalb des Bildes abstellt, 
kann der Montageprozess als deren nochmalige Metarelationierung verstan- 
den werden. 

Was das Konzept der dokumentarischen Methode von anderen empiri- 
schen Zugängen unterscheidet, ist sein mediensensibles Design, welches die 
Idee in Betracht zieht, dass Bilder „selbstreferentielle Systeme“ (Bohnsack, 
2009, S. 13) sind, die nicht direkt in Text übersetzt werden können - ein 
Umstand, der laut Bohnsack (2009) von den textorientierten Sozialwissen- 
schaften bisher vernachlässigt wurde. Während Texte aber nur durch sequen- 
zielle Wortidentifizierung verstanden werden können, arbeiten Bilder in 
einem simultanen Modus und auf vorverbalen und präkonzeptuellen Ebenen. 
Imdahl (1996) fügt dem noch seine analytische Unterscheidung von wieder- 
erkennendem Sehen und sehendem Sehen hinzu. Ersteres bezieht sich auf den 
gewöhnlichen Kommunikationsmodus von Wahrnehmung, der auf die Identi- 
fizierung von Objekten, Menschen oder spezifischen Situationen gründet; 
Letzteres impliziert die sofortige formale Wahrnehmung eines Bildes in Be- 
zug auf Umrisse, Farben, Größe, Gewicht und Richtungen. Während das 
Sehvermögen auch durch Mittel der Textinterpretation zugänglich ist, kann 
die spezifische Medienqualität von Bildern nur durch die empirische Rekon- 
struktion des sehenden Sehens offengelegt werden. Hinsichtlich differenziel- 
ler Medienanalysen berücksichtigt die dokumentarische Methode beide Inter- 
pretationsebenen. Diese Position geht auch mit McLuhans Hinweis (2003) 
konform, dass der Inhalt eines jeglichen Mediums nur durch die Untersu- 
chung seiner formalen Charakteristiken verstanden werden kann. Medien 
(re-)konfigurieren das menschliche Leben ständig — sie haben die Macht, 
bestimmte Aspekte zu erweitern und gleichzeitig andere zu reduzieren. Stu- 
dien zu den Effekten von Mediennutzung zufolge ist zu beachten, dass Men- 
schen sich zwar der Erweiterungen bewusst sind, der Einschränkungen aber 
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nicht gewahr werden.*' Das führt zu der Beobachtung, dass ein Medium 
immer dann aus dem Bewusstsein der Menschen verschwindet, sobald es 
erfolgreich in alltägliche Lebenspraktiken eingebunden ist. Latour (1998, S. 
41) nennt diesen Prozess „reversibles Blackboxing“*’; Slunecko und Przy- 
borski (2009) sprechen von einem ,,Unsichtbar-Werden“. Im Hinblick darauf, 
dass Musikvideos gerne angesehen werden, bedeutet dies, dass sie ebenfalls 
die Erfahrung ihrer Zuschauer/innen physisch beeinflussen, und zwar unmit- 
telbarer als die Begriffe Fernsehen und Internet vermuten lassen*’. Beide 
Medienformen sind mittlerweile symbiotisch mit den Menschen verwachsen 
und zu Extensionen des physischen Organismus geworden. 


8.3 Methodologische Herausforderungen an die Video- und 
Filminterpretation 


Die Materialgattung Musikvideo stellt die Video- und Filminterpretation nach 
der dokumentarischen Methode (Bohnsack, 2009) vor methodologische Her- 
ausforderungen und zeigt zugleich deren Entwicklungspotentiale auf. Als 
hochkondensierte Dokumente audiovisueller Massenkommunikation sind 
Musikvideos in ihrer Bilddimension u.a. durch rasante Schnittfolgen, stark 
ineinander verschachtelte Sequenzen sowie ein elaboriertes Farbkonzept 
charakterisiert. Das gängige Prozedere der Arbeitsschritte der Film- und 
Videointerpretation wurde, wie sich unter anderem in diesem Band zeigt, 
bisher zur empirischen Rekonstruktion verschiedenster Fallmaterialien er- 
probt — TV-Shows, Amateur-, Unterrichts-, Reisevideos, Werbespots etc. 
(siehe auch: Baltruschat, 2010; Bohnsack, 2009; Hampl, 2010; Sobotka, 
2009). Musikvideos aber sperren sich gegen dieses Vorgehen, aufgrund der 
erwahnten Eigensinnigkeiten auf der Ebene des Videoschnitts bzw. der Mon- 
tage. Zugleich erweist sich die Rekonstruktion der Farbkontraste von Mu- 
sikvideos als vielversprechender Schlüssel für ein tiefergehendes Verständnis 
der Relationierung von Einstellung und Montage und damit des Dokument- 
sinns bzw. der Ikonik. In weiterer Folge möchte ich am Beispiel eines kon- 
kreten Musikvideos meine diesbezüglichen Beobachtungen sowie die davon 
abgeleitete Vorgehensweise erläutern. Dabei halte ich mich aus Gründen der 


81 Kleidung zum Beispiel bietet dem Körper nicht nur Schutz gegen Kälte, sie verdeckt auch 
die Haut vor der öffentlichen Sphäre und privatisiert sie damit (McLuhan, 2003, S. 161). 
Das ganze soziale Konzept von „Nacktheit” (und allem, was mit ihr verbunden ist) wäre 
ohne die täglichen Zeremonien des An- und Ausziehens nicht verständlich. 

82 Vgl. dazu auch Schäffer (2001, S. 55). 

83 In dieser Hinsicht mag es angemessener sein, Fernsehen als Anchivision („Nahsehen”) zu 
bezeichnen und das Internet als Infranet (,,Unter-die-Haut-gehendes Netz“). 
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Nachvollziehbarkeit grundsätzlich an jenen Ablauf der Arbeitsschritte, wel- 
chen Bohnsack (2009) für die dokumentarische Video- und Film- 
interpretation vorgestellt hat. Nur an den Stellen, die sich durch die besondere 
Struktur des Untersuchungsgegenstandes Musikvideo ergeben, weiche ich 
davon ab und erörtere empirisch-methodologisch begründbare Lösungsan- 
sätze. Die in diesem Zusammenhang erforderlichen Forschungsentscheidun- 
gen und Überlegungen beruhen jedenfalls auf den metatheoretischen Grund- 
annahmen der dokumentarischen Methode (Bohnsack, 2007, 2009). 

Einschränkend sei an dieser Stelle erwähnt, dass der Fokus der anschlie- 
Benden Videointerpretation aus erkenntnistheoretischen Gründen auf der 
Rekonstruktion der Bilddimension liegt und dabei nicht genauer auf die Ton- 
bzw. Textdimension eingegangen wird. Diese Vorgehensweise mag gerade 
für die Betrachtung von Musikvideos unplausibel erscheinen. In Hinblick auf 
die Leistungsfähigkeit der dokumentarischen Video- bzw. Filminterpretation 
interessiert mich jedoch, wie weit die Instrumente zur Rekonstruktion der 
Bilddimension tragfähig sind. Die methodologische Einklammerung der 
Tondimension ist erforderlich, um diese Brüche aufzuspüren. 


8.3.1 Die Produktionsverhältnisse von Musikvideos gegenüber 
Fernsehshows 


Musikvideos sind in noch weit stärkerem Maße als etwa Fernsehshows 
(Bohnsack, 2009; Hampl, 2010; Sobotka, 2009) durch die Leistungen der 
abbildenden Bildproduzent/inn/en geprägt. Im Falle von Fernsehshows haben 
die abgebildeten Bildproduzent/inn/en (z. B. Moderator/inn/en und Inter- 
viewpartner/innen) — u. a. bedingt durch den Livecharakter der Aufnahmen — 
noch gewisse situative Handlungsspielräume, die in Musikvideos fehlen. Des 
Weiteren beschränkt sich im Falle von TV-Sendungen der Schnitt, wie 
Bohnsack (2009) erläutert, in der Regel auf die sogenannte Bildmischung. 
Dabei wird der zeitliche Ablauf der Aufnahmen beim Schnitt beibehalten. 
Die Montagetätigkeit im Rahmen der Bildmischung besteht damit vornehm- 
lich im Hin- und Herschalten zwischen simultan laufenden Kameras. Auch 
die Postproduktion, d.h. sämtliche Leistungen der abbildenden Bildprodu- 
zent/inn/en, die nach der Aufnahme erbracht werden, ist in der Regel auf 
kleine Veränderungen (z.B. das Hinzufügen des Logos der Sendeanstalt oder 
die Einblendung von Personennamen) beschrankt.** Demgegenüber sind in 
Musikvideos die Leistungen der abbildenden und abgebildeten Bildprodu- 


84 Eine Ausnahme stellt das Beispiel der Beyaz-Show dar, welches in Kapitel 6 behandelt 
wird. Die kontrollierenden Eingriffe der Postproduktion bestehen dabei im Abschneiden 
und im sogenannten Voice-over (,,Ubersprechen“) des ursprünglichen Videomaterials. 
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zent/inn/en vor, während und nach der Aufnahme durch die abbildenden?” 
Bildproduzent/inn/en einer unausweichlichen und vollständigen Kontrolle 
unterworfen”®. Im Rahmen professioneller Videoproduktionen kommt der 
Montage daher eine Schlüsselrolle zu. Nicht nur werden die Aufnahmen in 
bestimmten Sequenzen aneinandergeschnitten — das Material wird auf der 
Bild- und Tonebene auch noch mehrfach nachbearbeitet und korrigiert. 


8.3.2 Farbkontraste, Montagemuster und Räumlichkeit 


In Abkehr von einem isolierten Farbverständnis entwickelte der Maler, 
Kunsttheoretiker und Kunstpädagoge Johannes Itten (2000, 2010) seine 
„Theorie der sieben Farbkontraste“. Hinsichtlich der empirischen Untersu- 
chung von Filmen und Videos haben Farbkontraste die bemerkenswerte Ei- 
genschaft, dass sie sich sowohl innerhalb als auch zwischen Fotogrammen 
dokumentieren. Fotogramme repräsentieren im Rahmen der dokumentari- 
schen Video- und Filminterpretation Einstellungen. Zur Untersuchung von 
Einstellungswechseln, d.h. von Montage oder Bildmischung, werden die 
Fotogramme am Übergang miteinander verglichen. Somit lässt sich die Be- 
stimmung von Farbkontrasten als Instrument zur wechselseitigen Validierung 
der Analyse der Einstellung, d.h. des Fotogramms in seiner Simultanstruktur, 
und der Montage, d.h. der Struktur der Sequenzialität, einsetzen. In diesem 
Zusammenhang kann die Rekonstruktion der Farbkontraste, die beim Ein- 
stellungswechsel entstehen, auch einen eigenen Zugang zur Montage eröff- 
nen. 

Im Fallmaterial des Musikvideos ,,Araba“ (1996) (siehe Videotranskript: 
Abbildung 55) betonen Farbwechsel die Schnitte und damit die Einstel- 
lungswechsel, indem sie den visuellen Kontrast zwischen den aufeinander- 
folgenden Einstellungen erhöhen.’ Werden Farben über den Schnitt hinweg 
beibehalten, entsteht vor diesem Hintergrund dagegen eine engere Verbin- 
dung zwischen den Einstellungen. In professionellen Film- und Videopro- 
duktionen werden laut Frost (2009) durch die Verbindung farblich homologer 


85 An dieser Stelle erscheint es erforderlich den Begriff der abbildenden Bildproduzent/inn/en 
mit Flusser (1997, S. 93) noch weiter zu differenzieren. Dieser unterscheidet jene Personen, 
„welche den Filmstreifen erzeugen“ und jene „die den Film erzeugen“. In diesem Sinn 
könnte die hier erwähnte zweite Gruppe von „abbildenden Bildproduzent/inn/en als „mon- 
tierende“ oder ,,postproduzierende“ Bildproduzent/inn/en bezeichnet werden. Letzteren at- 
testiert Flusser eine weitreichendere Allmacht als Gott, denn dieser müsse sich zumindest 
an die zeitliche Linearität der Geschichte halten. 

86 Es geht mir hier um eine analytische Unterscheidung von Funktionen. Diese funktionale 
Differenzierung schließt nicht aus, dass Videos und Filme auch von einer Person in Perso- 
nalunion produziert werden können. 

87 Diese Rolle der Farben beim Schnitt wird auch von Computerprogrammen zur automati- 
schen Schnitterkennung genutzt. 
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Einstellungen auch Räume" und Atmosphären geschaffen bzw. durch die 
Verbindung farblich heterogener Einstellungen Ortswechsel angezeigt. Aus 
der empirischen Rekonstruktion der Verhältnisse von Einstellungs- und 
Farbwechseln sind im Rahmen der Montage somit auch Zugänge zur spatia- 
len und temporalen Ordnung von Filmen und Videos zu erwarten. 


8.4 Zur Auswahl der Sequenzen: Repräsentanz und 
Fokussierung 


Als Strategien für die Auswahl geeigneter Sequenzen können nach Bohnsack 
(2009, S. 196) das Kriterium der „Repräsentanz“ sowie die Kriterien von 
„Fokussierungen“ bzw. „Diskontinuitäten und Brüchen“ im Material einge- 
setzt werden. Hinsichtlich der Auswahlstrategie der Repräsentanz stellt die 
Gattung der Musikvideos eine große Herausforderung dar. Im Gegensatz zu 
moderierten TV-Unterhaltungssendungen (etwa: Bohnsack, 2009; Hampl, 
2010) oder Amateurvideos (etwa: Baltruschat, 2010), die formal durch eine 
überschaubar geringe Anzahl an Einstellungen und Schnitten bestimmt sind, 
artikuliert sich in der rhythmisierten Bildsprache von Musikvideos zum einen 
eine enorm hohe Schnitt- und Einstellungsdichte. Oft wird im Sekunden- 
rhythmus oder sogar in noch kürzeren Zeitintervallen geschnitten, was zu 
einer starken Zergliederung des Materials führt. Zum anderen sind einzelne 
Einstellungen bzw. Sequenzen teilweise mehrfach kompositorisch ineinander 
verschränkt. Zwar gibt es Einstellungen, die häufiger und weniger häufig 
auftreten, doch lassen sie sich nicht ohne weiteres in einem hierarchischen 
Verhältnis von Haupt-, Unter- und eingelagerten Sequenzen verstehen. Diese 
spezifische Gattungsproblematik verdeutlicht rein visuell auch das Video- 
transkript (Abbildung 55) der Eingangspassage des Musikvideos „Araba“ 
(1996). 


88 Nicht umsonst gibt es im Deutschen den Begriff „Farbraum“. 
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9 „Araba“ (1996): Die Version für den türkischen 
Markt 


Als Fallmaterial wurde im Anwendungsbereich der Interpretation von Filmen 
als Alltagsdokumenten (Bohnsack, 2009) das Musikvideo „Araba“? des 
türkischstämmigen Popstars Mustafa Sandal in der Version von 1996 ausge- 
wählt. Laut eigenen Angaben des Sängers (in der deutschen Late-Night-Show 
„Istanbul Total®) handelt es sich bei dem durch das Video propagierten 
Popsong um den größten Erfolg seiner Karriere. Das Album ,,Araba“ wurde 
von der Plattenfirma Sony Music France über 2.000.000 Mal verkauft.”! 


9.1 Auswahl der Sequenzen 


Dem Beispiel Bohnsacks folgend (Bohnsack, 2009, S. 175) lassen sich die 
Fokussierungskriterien zur Auswahl der Sequenzen (Kap. 8.4) miteinander 
kombinieren: Im vorliegenden Fall wurden aus den beiden Musikvideos von 
„Araba“ die ersten vierzig Sekunden ausgewählt, da sie einerseits im Sinne 
einer Eingangspassage in das Musikvideo einführen und andererseits durch 
kompositorische Auffälligkeiten auf der Ebene des Schnitts sowie einzelner 
Einstellungen gekennzeichnet sind. 


9.2 Videotranskription der Eingangspassage nach dem 
System MoViQ 


Das folgende Videotranskript wurde mit dem Programm MoviScript” (siehe 


Kap. 3) erstellt. Da der methodologische Fokus dieses Kapitels, wie eingangs 
analytisch begründet, in der Rekonstruktion der Bilddimension liegt, handelt 
es sich um ein reines Bildtranskript ohne Text- bzw. Tonspur. 


89 zu Deutsch: Auto, Karren 

90 Auftritt am 12.Mai 2004. Link: http://tvtotal.prosieben.de/tvtotal/videos/player/?contentld 
=14163 

91 Mustafa Sandal erhielt im Rahmen der türkischen Kral Music Awards dafür die Auszeich- 
nung „Bester Popsänger des Jahres“. Außerdem wurde „Araba“ in der Türkei zum „besten 
Song des Jahres“ gekürt. 

92 www.moviscript.net 
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Passage (oder Sequenz): 
Film (oder Video): 
Dateiname oder URL: 
Time Code: 

Dauer: 

Transkription: 


Korrektur 


ag O sec. 


Eingangspassage 
Araba“ (1996) für den türkischen Markt 


http://www.youtube.com/watch?v=b0Om8YPF3N70 
0-39 


0:40 min. 
Stefan Hampl 


Stefan Hampl 


1 sec 


9.3 Formulierende Interpretation der Sequenzen 


Entsprechend der nach Bohnsack (2009, S. 198) vorgegebenen Arbeits- 
schritte setzt die Videointerpretation des Musikvideos mit der formulierenden 
Interpretation der Sequenzen ein. Auf der Basis der ikonografischen Untersu- 
chung der Bildinhalte gelingt dabei — trotz hoher Zergliederung des Materials 
— durchaus die Identifikation von zusammenhängenden Sequenzen. Probleme 
bereitet jedoch die Zuordnung der Sequenzen zu den üblichen Kategorien der 
Film- und Videointerpretation „Hauptsequenz“ (HS), „Untersequenz“ (US) 
und „eingelagerte Sequenz“ (ES). Wie das Videotranskript (Abbildung 55) 
verdeutlicht, ist diese aufgrund der hohen Schnittdichte und Verschachtelung 
der Sequenzen kaum möglich. Als eingelagerte Sequenzen könnten mitunter 
noch jene Sequenzen betrachtet werden, die nur einmal im Videotranskript 
auftreten. In der folgenden Liste wären dies „Fischer“ (21-23), „Schiffsbug“ 
(29), „Filmcountdown“ (0-1) und „Hund“ (26). Genau genommen ist der 
Fischer jedoch auch im Hintergrund der Sequenz „Ruderer“ (US: 31; 33; 35— 
36 Ruderer von hinten vor Ruderboot und Fischer; Amerikanische”) zu se- 
hen, wodurch der Versuch der Sequenzzuordnung wieder konterkariert wird. 
Die Sequenzen „Ferrari“ (8-9,5; 15-17; 24-25; 32; 34; 37; 39), „Ruderer“ 
(9,5-14; 18-20,5; 31; 33; 35-36; 38) und „Sänger“ (2-7,5; 27-28) wiederum 
könnten jeweils sowohl als Haupt- und Untersequenzen als auch als eingela- 
gerte Sequenzen aufgefasst werden. Da an der Zuordnung der Sequenzen 
nach Bohnsack (2009, S. 201) in weiterer Folge die Auswahl repräsentativer 
Fotogramme hängt, entsteht hier ein Entscheidungsproblem. Für dessen Lö- 
sung war ich im vorliegenden Fall gezwungen, von den üblichen Arbeits- 
schritten (Bohnsack, 2009, S. 176) abzuweichen, ohne diese völlig aufzuge- 
ben. Aus forschungspraktischer Sicht kann es als vertretbarer Kompromiss 
angesehen werden, vorerst von einer hierarchischen Ordnung der Sequenzen 
(HS, US, ES) abzusehen und lediglich von reinen Sequenzen zu sprechen. 
Zur Auswahl der Fotogramme lassen sich dann auf der Basis ihrer (ikonogra- 
fischen) „Kontinuität oder Identität im Bereich dessen, was abgelichtet wird“ 
(Bohnsack 2009, S. 196) die umfangreichsten Sequenzen der Eingangspassa- 
ge heranziehen. Im vorliegenden Falle sind dies die Sequenzen „Ferrari“, 
„Ruderer“ und „Sänger“. 


93 Als „Amerikanische“ bzw. „amerikanische Einstellung“ wird ein Bildausschnitt bezeichnet, 
bei dem die Personen vom Kopf bis etwas unterhalb der Hüfte zu sehen sind. 
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9.3.1  Vorikonografische Interpretation der Sequenzen bzw. Schnitte 


1. TC* 0-1 Abwärtszählender Countdown: 5,4,3,2 

2. TC 2-7 Sitzender Mann 

3. TC 8-9,5 Teile eines gelben Autos 

4. TC 9,5-14 Ein Mann geht an einem Ruderboot entlang 
5. TC 15-17 Teile eines gelben Autos 

6. TC 18-20,5 Mann und Ruderboot 

7. TC 20,5-23 Aufwachender Mann im Ruderboot 

8. TC 24-25 Teile eines gelben Autos 

9. TC26 Auf der Straße liegender Hund 

10. TC 27-28 Sitzender Mann 

11. TC 29 Schiffsbug mit Bugwelle 

12. TC 30-31 Mann und Ruderboot 

13. TC 32 Teile eines gelben Autos 

14. TC 33 Mann und Ruderboot 

15. TC 34 Teile eines gelben Autos 

16. TC 35-36 Mann und Ruderboot 

17. TC 37 Hände am Lenkrad 

18. TC 38 Hände an den Fußrasten eines Ruderboots 
19. TC 39 Hände am Lenkrad 


9.3.2 Ikonografische Interpretation bzw. Auswahl der Sequenzen 


Wie zuvor erwähnt, ist zur Bestimmung von Hauptsequenzen (HS) übli- 
cherweise die Feststellung einer „Identität in der Szenerie oder Teilen der 
Szenerie“ (Bohnsack, 2009, S. 196) erforderlich. Innerhalb der Hauptsequen- 
zen stellen Untersequenzen (US) Variationen der Bildinhalte dar. Auf Basis 
dieser Konzeption lässt sich in weiterer Folge eine provisorische Zuordnung 
von Sequenzen argumentieren, auch wenn die zweifelsfreie Sequenzzuord- 
nung beim vorliegenden Fallmaterial schwierig ist (s.o.). Dieser Schritt ist 
erforderlich, um nach dem Schema der üblichen Arbeitsschritte eine Auswahl 
repräsentativer Fotogramme treffen zu können. 


a) Sequenz „Ferrari“ 
US 8-9,5 Ferrari von hinten in Detailaufnahme 
US 15-17; 34 Ferrari von vorne in Detailaufnahme 


US 24-25; 32 Ferrari von der Seite in Detailaufnahme 


94 TC ist die in Videotranskripten gebräuchliche Abkürzung für „Time Code“. 
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b) 


c) 


d) 


e) 


g) 


US 37; 39 


Sequenz „Ruderer“ 


US 9,5-14 
US 18-20,5 
US 31; 33; 35-36 


US 38 


Sequenz „Sänger“ 


US 2-7,5; 27-28 


Sequenz „Fischer“ 


US 20,5-23 
US 31; 33; 35-36 


Sequenz „Schiffsbug“ 
US 27,5-30 


Hände am Lenkrad des Ferraris in Detailauf- 
nahme 


Ruderer von hinten neben Ruderboot; De- 
tailaufnahme 

Ruderer von der Seite neben Ruderboot; 
Halbtotale 

Ruderer von hinten, vor Ruderboot und Fi- 
scher; Amerikanische 

Hände an Fußrasten des Ruderboots; De- 
tailaufnahme 


Sanger im Schneidersitz von vorn; Totale 


Liegender Fischer; Halbtotale 
Ruderer von hinten, vor Ruderboot und Fi- 
scher; Amerikanische 


Schiffsbug mit Bugwelle; Detailaufnahme 


Sequenz „Filmcountdown“ 


US 0-1 


Sequenz „Hund“ 


US 26 


Filmcountdown 


Liegender Hund; Totale 


9.4 Auswahl der Fotogramme 


Die Auswahl der Fotogramme stellt im Rahmen der dokumentarischen Me- 
thode kein grundsätzliches Problem dar, da sich der Modus Operandi der 
abgebildeten und abbildenden Bildproduzent/inn/en seinem Wesen nach aus 
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jedem beliebigen Fotogramm eines Films oder Videos rekonstruieren lassen 
muss.” Dadurch ist jedoch nicht ausgeschlossen, dass im Fallmaterial Foto- 
gramme zu finden sind, die aufgrund ihrer formalen und inhaltlichen Be- 
schaffenheit geeigneter als andere zur Beantwortung des Erkenntnisinteresses 
sind. Der Dokumentsinn von Filmen oder Videos tritt in den einzelnen Foto- 
grammen unterschiedlich stark fokussiert zutage. Nicht zuletzt auch im Sinne 
der Erhöhung der Nachvollziehbarkeit des Auswahlprozesses und eines ge- 
ringeren interpretativen Aufwandes, also aus ökonomischen Gründen, tritt 
Bohnsack (2009, S. 201) für eine gut argumentierte Auswahl von Fotogram- 
men ein. Als Auswahlstrategien schlägt er neben dem Kriterium der Reprä- 
sentanz das der Fokussierung vor. Unter Repräsentanz versteht er die Ver- 
knüpfung zwischen den im Film- oder Videomaterial identifizierten Sequen- 
zen (Hauptsequenz, Untersequenz) und den aus ihnen ausgewählten Einzel- 
bildern: „Fotogramme [sollten] zumindest die beiden umfangreichsten 
Hauptsequenzen (HS) in deren umfangreichsten Einstellungsvarianten, also 
in den Untersequenzen (US), repräsentieren [...]“ (Bohnsack, 2009, S. 201). 
Fokussierungen im Film- oder Videomaterial lassen sich laut Bohnsack 
(ebenda) in Form von „dramaturgischen Steigerungen“, aber auch durch 
„Diskontinuitäten und Brüche“ erkennen. Da in diesem Kapitel die Untersu- 
chung der Montage bzw. der Einstellungswechsel von vorrangigem Interesse 
ist, habe ich aus den Sequenzen „Ferrari“ und „Ruderer“ jeweils ein Foto- 
gramm aus deren Übergangsbereich gewählt: Fotogramm 16 und Fotogramm 
18. Aus der Sequenz „Sänger“ wurde das Fotogramm 6 ausgewählt, das den 
Sänger in einer auffälligen Mimik und Körperhaltung zeigt. Da in diesem 
Kapitel die Untersuchung der Montage bzw. der Einstellungswechsel von 
vorrangigem Interesse ist, habe ich aus den Sequenzen „Ferrari“ und „Rude- 
rer“ jeweils ein Fotogramm aus deren Übergangsbereich gewählt: Foto- 
gramm 16 und Fotogramm 18. Aus der Sequenz „Sänger“ wurde das Foto- 
gramm 6 ausgewählt, das den Sänger in einer auffälligen Mimik und Körper- 
haltung zeigt. 


95 Zur Auswahl von Fotogrammen siehe auch Baltruschat und Hamp! (2013). 
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9.5 Interpretation der Fotogramme 


95.1 HS/ES I: „Ferrari“ 


A 


1% 
Bu klip www.remixland.de tarafindáA Sunu! 


Abbildung 56: Fotogramm 16, Sequenz „Ferrari“ 


a) Formulierende Interpretation 


Vorikonografische Interpretation 


Fast vollständig bildfüllend ist ein Ausschnitt eines gelben Sportautos zu 
sehen. Ein Teil seiner Front sowie der linken Wagenseite erstreckt sich vom 
Bildvorder- bis in den Bildmittelgrund. Im Mittelgrund ist vor der dunklen 
Frontscheibe des Autos am linken Bildrand der Teil eines Scheibenwischers 
erkennbar. In der rechten Bildhälfte ragt der gelbe Seitenspiegel zur Seite. Im 
Bildhintergrund sind in der linken Bildhälfte hinter der Frontscheibe des 
Autos die Konturen von Armaturenbrett und Lenkrad erkennbar. In der rech- 
ten Bildhälfte ist brauner Schotter zu sehen. 

Ober- und unterhalb des Bildes befinden sich schwarze horizontale Bal- 
ken. Links im oberen Balken steht in blauer Schrift „remixland.de“. Im Bal- 
ken in der unteren Bildhälfte steht „www.remixland.de tarafindan sunul- 
mustur“. Rechts unten über den Buchstaben ,,ustur“ befindet sich ein rotes 
Dreieck mit der weißen Inschrift „NEV TV“. 
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Ikonografische Interpretation 


Bei dem gelben Auto handelt es sich um einen Luxussportwagen der Marke 
Ferrari mit getönten Scheiben und Leichtmetallfelgen. Bei den schwarzen 
Balken ober- und unterhalb des Bildes handelt es sich um eine sogenannte 
„Letterbox“.”° Das obere Wort in der Letterbox kann aufgrund der Endung 
„de“ als deutsche Internetseite interpretiert werden. Der untere Text in der 
Letterbox ist türkisch und bedeutet „präsentiert von (ww)w.remixland.de“. 
NEV TV ist der Name eines ehemaligen türkischen Musik-TV-Senders, über 
den das Musikvideo ursprünglich ausgestrahlt werden durfte. Die Texte mit 
Bezug auf remixland.de, welche sich vor dem Logo des Senders befinden, 
weisen darauf hin, dass jemand das Video digital aufgezeichnet hat, um es 
dann im Internet über die Website www.remixland.de zu verbreiten.” 


b) Reflektierende Interpretation 


Planimetrische Komposition 


Der gelbe Ferrari bzw. zumindest dessen Ausschnitt ist im Bild planimetrisch 
fokussiert, da er fast das gesamte Bild ausfüllt. Diese Fokussierung ist durch 
drei Feldlinien charakterisiert, die ihren gemeinsamen Schnittpunkt am Fuße 
der A-Säule des Ferraris, knapp unterhalb des fahrerseitigen Rückspiegels 
haben (Abbildung 57). 


96 Zu der Zeit, als das Fernsehen noch ein Seitenverhältnis von 4:3 aufwies, waren Letterbo- 
xes aus technischen Gründen erforderlich, um im Seitenverhältnis 16:9 aufgenommene Ki- 
nofilme auf Fernsehgeräten darzustellen. Aufgrund dieses Zusammenhangs werden Letter- 
boxes in Musik- oder Werbevideos oft aus ästhetischen Gründen (im Zuge der Montage 
bzw. Postproduktion) hinzugefügt, um Videos eine spielfilmartige Anmutung zu verleihen. 

97 Die Texte in den Letterboxes wurden dem Musikvideo nachträglich hinzugefügt und flie- 
ßen daher nicht in die weitere Interpretation ein. Es handelt sich bei ihnen um die Leis- 
tungen sekundärer und tertiärer Bildproduzent/inn/en, in denen sich dokumentiert, dass es 
sich um ein populäres Musikvideo handelt. Das Erkenntnisinteresse der Arbeit ist jedoch 
auf die Leistungen der primären Bildprodzent/inn/en gerichtet. 
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| | & 
Bu klip www.remiixland.de tarafindan Sunul 


Abbildung 57: Fotogramms 16 mit Feldlinien 


Die Feldlinie A verläuft gerade, aber in leichter Schräge von oben nach unten 
entlang der A-Säule und dann weiter über den Kotflügel und den Radkasten 
des Ferraris. Die Feldlinie B krümmt sich entlang des Spalts von Motorhaube 
und Kotflügel über den Seitenspiegel nach rechts. Die Feldlinie C verläuft 
von links nach rechts schräg abwärts entlang der Unterseite der Windschutz- 
scheibe. 

Des Weiteren ist der Wagen auch farblich fokussiert. Das Bild ist von ei- 
nem starken Gelb-Schwarz-Kontrast geprägt. Nach Ittens (2000, 2010) Sys- 
tem der Farbkontraste dokumentieren sich hierin drei der sieben Farbkon- 
traste: a) der Hell-Dunkel-Kontrast (durch strahlendes Gelb und Weiß gegen- 
über Schwarz), b) der Qualitätskontrast (durch gesättigtes in Gegenwart von 
ungesättigtem bzw. abgedunkeltem Gelb) und c) der Quantitätskontrast (Gelb 
besitzt gegenüber allen anderen gesättigten Spektralfarben den höchsten 
Helligkeitswert). Unter Berücksichtigung der nachträglich hinzugefügten 
Logos und Texte von NEV TV und Remixland könnte auch ein Farbe-an- 
sich-Kontrast geltend gemacht werden (durch Vorhandensein aller drei 
Grundfarben im Bild: Gelb, Rot und Blau). 


Perspektivische Konstruktion 


Der gelbe Ferrari ist in Schrägperspektive aufgenommen. Beide Fluchtpunkte 
befinden sich außerhalb des Bildes. Unter der Voraussetzung, dass die Fahr- 
zeugkanten in der Realität parallel zueinander verlaufen, können deren Linien 
verlängert und so der erste Fluchtpunkt (FP 1) bestimmt werden. Er befindet 
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sich vermutlich rechts oberhalb des Bildes. Der zweite Fluchtpunkt kann aus 
der Verlängerung der Windschutzscheiben und des Luftschlitzes annähe- 
rungsweise erschlossen werden. Als Verbindungslinie zwischen den Flucht- 
punkten ergibt sich so die Horizontlinie, die zugleich die Höhe der Kame- 
raposition reflektiert. 


Horizontlinie/Aufnahmehöhe der Kamera FP1 


WG 
Bu klip www.remixland.de tarafindän Sunu 


Abbildung 58: Fotogramm 16 mit perspektivischen Linien 


Bei diesem Bild haben wir es — in Kombination mit der starken Aufsicht — 
mit einer markanten Schrägperspektive zu tun, die das Bild durch die weit 
auseinanderliegenden Fluchtpunkte stark in der Horizontale ausdehnt (Sei- 
tensicht). Dadurch gewinnt der abgebildete Ferrari massiv an „visuellem 
Gewicht“ (Arnheim, 2000, S. 26). Dieser Effekt wird zusätzlich verstärkt, 
indem die Kamera aus erhöhter Position nach unten gerichtet ist (Aufsicht). 
So wird im Bild nämlich der Eindruck der Räumlichkeit betont, wodurch der 
Ferrari weiteres Volumen erhält und in seiner ganzen körperlichen Materia- 
lität (jenseits einer technisch-instrumentellen Funktionalität) zur Geltung 
kommt. Um den Eindruck zu verdeutlichen, der durch die perspektivische 
Konstruktion des Bilds entsteht, habe ich hier ein Vergleichsbild eingefügt. 
Der Ferrari wirkt wie ein aufgeblasenes „Fat Car“ des österreichischen 
Künstlers Erwin Wurm. 
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Abbildung 59: Erwin Wurm (1993). Fat Car (roter Porsche), 
Quelle: http://www.dsgnwrld.com 


Szenische Choreografie 


Hinsichtlich der szenischen Choreografie ist der gelbe Ferrari, ebenso wie auf 
den vorhergehenden Interpretationsebenen, bildbestimmend. Hinter der ver- 
spiegelten Windschutzscheibe des Sportwagens ist kein Fahrer erkennbar. 
Damit ist der Ferrari das einzige Objekt im Bild. Aufgrund dieser besonderen 
Einzelstellung und insbesondere des fehlenden Fahrers sowie der Aufnahme 
im Dreiviertelprofil wird der Ferrari seiner technischen Funktionalität entho- 
ben und wirkt letztlich wie ein Ausstellungsobjekt in einer Kunstgalerie — 
vergleichbar dem „fetten“ roten Porsche von Erwin Wurm. 


Ikonologische bzw. Ikonische Interpretation 


Im Sinne der zusammenfassenden Interpretation des Fotogramms und damit 
dieser Sequenz kann gesagt werden, dass der gelbe Ferrari auf sämtlichen 
Analyseebenen fokussiert ist. Die Übergegensätzlichkeit dieses Luxussport- 
wagens besteht darin, dass hier ein technisch-funktionales Gerät zum Zwecke 
der Mobilität zu etwas Unlebendigem, Unbelebtem, Ornamentalem wird. 
Darin zeigen sich Homologien zu Wurms rotem Porsche. Dies gilt auch für 
das Fehlen der Person des Fahrers, derer es bedarf, um die technische Funkti- 
onalität und Mobilität zu sichern. 
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9.5.2 HS/ES II: ,, Ruderer“ 


A y 


d.de tarafindan sunulmustur 


Abbildung 60: Fotogramm 18, Sequenz „Ruderer“ 


a) Formulierende Interpretation 


Vorikonografische Interpretation 


Im Bildvordergrund sind ein schwarz-weißes Ruderboot sowie ein graues 
Stück Mauer zu sehen, die sich weiter in den Bildmittelgrund erstrecken. Auf 
der Mauer liegen zwei schaufelartige Ruder. Im Bildmittelgrund befinden 
sich links mehrere weiße Boote und Masten auf einer Wasserfläche sowie 
rechts eine Häuserzeile. Davor ist ein stehender Mann in grauem Pullover 
und schwarzer Mütze zu sehen. Der Mann ist der Wasserfläche zu- und den 
Bildbetrachter/inne/n abgewandt. Er stützt sich mit dem rechten Arm auf den 
Balken. Der linke Arm ist angewinkelt Richtung Hals geführt, sodass die 
Hand nicht sichtbar ist. Im Bildhintergrund befindet sich ein hellblauer 
Himmel mit einigen weißen Wolken. 


Ikonografische Interpretation 


Das Bild zeigt den Ausschnitt einer Hafenanlage mit privaten Segel- und 
Motorjachten. In dieser Umgebung bereitet sich ein Ruderer darauf vor, in 
See zu stechen. Ruder und Ruderboot sind an der Hafenmole bereitgelegt. 
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b) Reflektierende Interpretation 


Planimetrische Komposition 


Abbildung 61: Fotogramm 18 mit Feldlinien 


Im Vergleich zu Fotogramm 16 mit dem gelben Ferrari ist Fotogramm 18 
weniger flächig, sondern eher kleinteilig, d.h. durch viele kleine Details 
strukturiert. Dennoch können dominante Feldlinien bestimmt werden. Feldli- 
nie A verläuft von links nach rechts oben entlang der Oberkante einer weißen 
Motorjacht und dann entlang der rechten Häuserzeile bis zur rechten oberen 
Bildecke. Feldlinie B verläuft gekrümmt entlang des Bootrumpfs sowie ent- 
lang der Mauer der Hafenmole nach oben spitz über den Oberkörper des 
Ruderers zu. Feldlinie C markiert seinen auffällig runden Hinterkopf. Der 
Ruderer im Bild ist dadurch fokussiert, dass sein Oberkörper aus der Feldli- 
nie A (Abbildung 61) hervorragt und sein Hinterkopf (Feldlinie C) eine be- 
sondere Betonung der Spitze von Feldlinie B darstellt. Durch die dominanten 
planimetrischen Linien entsteht eine starke Dynamik nach links, infolge derer 
der Ruderer nach links zu kippen scheint. Die Gesamtkonstellation ragt wie 
ein hoher Felsen, eine Welle oder ein scharfer Zahn in den Himmel. 

Farblich gesehen ist das Bild eher blass gehalten und nicht durch starke 
Farbkontraste bestimmt. Daher dokumentiert sich in ihm auch keiner der 
Farbkontraste aus dem Fotogramm mit dem gelben Ferrari. Am deutlichsten 
ist noch der Hell-Dunkel-Kontrast ausgeprägt. Dieser hat nach Itten (2000, 
2010) eine zweifache Wirkung: Zum einen werden durch Helligkeitsunter- 
schiede Konturen und Formen betont. So wird etwa die schwarze Mütze des 
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Ruderers vor dem hellblauen Hintergrund im Bild hervorgehoben. Zum ande- 
ren erstreckt sich im Intervall von Hell und Dunkel eine „ungewöhnlich gro- 
Be Zahl von hellen und dunklen Grautönen“ (Itten, 2010, S. 37). Neutrales 
Grau hat die besondere Eigenschaft, auch von schwachen Nachbarfarben zu 
einer komplementären Farbwirkung angeregt zu werden. Dieser zweite Effekt 
des Hell-Dunkel-Kontrasts ist eher subtil und beeinflusst vor allem die glo- 
bale Atmosphäre des Bildes. Der in leichtes Hellblau getünchte Himmel regt 
die „graue“ Umgebung dazu an, in komplementärem Rot-Orange zu erschei- 
nen. Dieser Effekt ist dafür verantwortlich, dass sich das Bild trotz seiner 
schwachen Farbsättigung deutlich von einem reinen Schwarz-Weiß-Bild 
unterscheidet. 


Perspektivische Konstruktion 


Horizontlinie 
entsprechend ( 
Kamerahaltung == 


Ursprüngliche 
rekonstruierbare 
Horizontlinie 

(ca. 10° Differenz) 


Abbildung 62: Fotogramm 18 mit perspektivischen Linien 


Im Vergleich zur perspektivischen Konstruktion des Ferrari-Fotogramms 
haben wir es im vorliegenden Fall (Abbildung 62) mit keiner Schrägperspek- 
tive, sondern einer gekippten Kamerahaltung zu tun, bei der es nur einen 
Fluchtpunkt (FP 1) in der Bildmitte gibt. Über die Bestimmung des Flucht- 
punkts lässt sich die Horizontlinie ermitteln. Diese reflektiert zugleich die 
Aufnahmehöhe der Kamera. Aus dem Unterschied zwischen Bildmittelsenk- 
rechter und Wasseroberfläche lässt sich zudem feststellen, dass die Kamera 
bei der Aufnahme um ca. zehn Grad im Uhrzeigersinn gekippt wurde. Dieser 
Umstand hat wesentliche Auswirkungen darauf, wie der Ruderer im Bild in 
Erscheinung tritt. Im vorliegenden Fall nimmt er eine Mittel- oder Mittlerpo- 
sition zwischen Wasser und Land ein, indem er aufrecht und frei neben einem 
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Ruderboot steht und damit Gefahr läuft, ins Meer zu kippen. Indem der 
Fluchtpunkt im Rücken des Ruderers liegt, gleichsam in seinen Rücken 
„drückt“, wird der Eindruck der Kippbewegung des Ruderers verstärkt. 

Dreht man das Bild im Sinne einer Kompositionsvariation nach Imdahl 
(1994) um ca. zehn Grad wieder in die ursprüngliche Horizontale zurück, 
erscheint der Ruderer stärker an das Ruderboot angelehnt bzw. aufgestützt 
und nimmt zum Wasser plötzlich eine distanzierte, fast sogar abweisende 
Haltung ein’ (siehe Abbildung 63). Zugleich wirkt das Bild insgesamt auch 
ruhiger und statischer, da die Boote am Ufer nun auf der glatten Wasserober- 
fläche fest verankert wirken und nicht mehr den Eindruck erwecken sogleich 
aus dem Bild zu rutschen. Durch die minimale Intervention des Kippens der 
Kamera bei der Aufnahme (Abbildung 60) wird der Ruderer somit derart ins 
Bild gesetzt, dass er als Mittler zwischen Land und Wasser auftreten kann. 
Obwohl sich die Position des Ruderers im Bild mit der Kippbewegung nicht 
verändert, wirkt er dadurch bemerkenswerterweise auch dynamischer, sport- 
licher und wagemutiger. Wie der empirische Bildvergleich verdeutlicht, ist 
dies seiner scheinbar aufrechteren Körperhaltung sowie der stärkeren Ge- 
samtdynamik des gekippten Bildes (z.B. abrutschende Boote) zu verdanken. 


d.de tarafindan sunulmustur 


Abbildung 63: Kompositionsvariation von Fotogramm 18 
(Das Bild wurde um ca. zehn Grad in die Horizontale zurückgedreht; feh- 
lende Bildteile wurden ergänzt.) 


98 In der Tat erinnert der durch die Kompositionsvariation hervorgerufene Effekt stark an 
Imdahls (1994) Beispiel anhand der Miniatur des Hauptmanns von Kapernaum (Codex Eg- 
berti). 
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Szenische Choreografie 


Auf der Ebene der szenischen Choreografie ist festzustellen, dass sich nur 
eine einzige Person, nämlich der Ruderer, im Bild befindet. Dieser ist in 
aufrechter Körperhaltung abgebildet. Hinter einem auf einem Gestell liegen- 
den Ruderboot sind sein Rücken, sein Hinterkopf sowie die Waden zu sehen, 
da er von den Bildbetrachter/inne/n abgewandt ist. Aus Kopf- und Körper- 
haltung kann geschlossen werden, dass der Ruderer vermutlich aufs Wasser 
hinausblickt. Aus seiner angewinkelten Armhaltung lässt sich mithilfe der 
nachfolgenden Fotogramme 19 und 20 (Abbildung 55) eine Geste rekonstru- 
ieren, die das Ausziehen des Pullovers vorbereitet. Gegenüber dem Ferrari- 
fahrer ist der Ruderer zwar im Bild zu sehen, gibt durch sein abgewandtes 
Gesicht jedoch ebenso wenig wie jener seine Identität preis. 


Ikonologische bzw. ikonische Interpretation 


Der Ruderer ist im Bild auf verschiedenen Ebenen durch die zentrale Über- 
gegensätzlichkeit seines simultanen Hervortretens und Verschwindens cha- 
rakterisiert. Planimetrisch gesehen, hebt er sich farblich kaum vor dem neu- 
tral grauen Hintergrund ab und ragt doch mit seinem Hinterhaupt aus der 
Kulisse der umliegenden Häuser und Schiffe hervor. Der so betonte Kopf des 
Ruderers ist seinerseits wiederum unter einer Sportmütze verborgen und nach 
hinten weggedreht. Im Gegensatz zum Ferrarifahrer gibt sich damit der Rude- 
rer zwar als Person zu erkennen, seine eindeutige Identifizierung wird aber 
durch das abgewandte Gesicht verhindert. In der rekonstruierten Gesichtslo- 
sigkeit von Ruderer und Ferrarifahrer dokumentiert sich letztlich eine bedeut- 
same Homologie zwischen den Fotogrammen, die durch deren starken Farb- 
kontrast zueinander nicht auf Anhieb auffällt. Zusammenfassend scheint sich 
empirisch der Verdacht zu erhärten, dass im Musikvideo (auf Ebene der Pla- 
nimetrie) aufgeworfenen Farbkontraste offensichtlich zur Maskierung ande- 
rer Bildinhalte (hier bspw. auf Ebene der szenischen Choreographie) geeignet 
sind. 
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9.5.3 HS/ES II: „Sänger“ 


Abbildung 64: Fotogramm 6, Sequenz „Sänger“ 


a) Formulierende Interpretation 


Vorikonografische Interpretation 


Im Bildvordergrund ist annähernd in Bildmitte ein am Boden sitzender Mann 
zu sehen, der den Bildbetrachter/inne/n direkt zugewandt ist. Gesicht und 
Oberkörper sind vollständig zu sehen. Seine Haare sind schwarz und kurz 
geschnitten, der Kopf ist leicht schräg etwas nach rechts und nach hinten 
gebeugt, der Mund ist geöffnet, die Mundwinkel sind angezogen. Sein Blick 
ist (von ihm aus gesehen) nach rechts oben gerichtet. Seine Arme hängen 
über die angewinkelten Beine bzw. Knie herab. Er ist mit einem grauen Po- 
loshirt, einer weißen Hose sowie schwarzen Schuhen bekleidet. An seinem 
rechten Handgelenk ist ein silbriges Armkettchen zu sehen, an seinem linken 
eine silbrige Armbanduhr. Der Bildhintergrund besteht im Wesentlichen aus 
großen, horizontalen Farbstreifen. Sie sind blassgrün, rosarot, weiß und oran- 
ge. Im oberen grünen Farbstreifen und im weißen Farbstreifen sind ver- 
schiedene Formen und Muster zu sehen. Der Hintergrund wird an der linken 
Bildkante durch eine weiß-grau-schwarz gemusterte Säule abgeschlossen. 
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Ikonografische Interpretation 


Der Mann im Bild ist der bekannte türkische Popsänger Mustafa Sandal. 
Seine Kleidung wirkt alltäglich, kann aufgrund der weißen Hose und der 
schwarzen Lederschuhe jedoch als sportlich-elegant bezeichnet werden. So- 
wohl die Armbanduhr als auch das Armkettchen lassen sich als Körper- 
schmuck auffassen. Die spezielle Körperhaltung wird als Schneidersitz be- 
zeichnet. Sie ist in verschiedenen Kulturkreisen sowohl bei meditativen Ent- 
spannungsübungen als auch bei manuellen Tätigkeiten (z. B. Nähen) oder 
beim Geschichtenerzählen in einer Gruppe (z. B. um ein Lagerfeuer sitzend) 
anzutreffen. In dieser Pose zeigt Mustafa Sandal ein strahlendes Lachen. Er 
sitzt vor einem Hintergrund auf dem in Trompe-l’CEil-Malerei verschiedene 
Naturmotive (Baumstämme, Steine, Gräser etc.) abgebildet sind. Am linken 
Bildrand befindet sich eine antik-orientalische Säule. 


b) Reflektierende Interpretation 


Planimetrische Komposition 


vianda 


Abbildung 65: Fotogramm 6 mit Feldlinien 


In planimetrischer Hinsicht ist der Sänger im Bild zum einen durch seine 
zentrale Position in der Bildmitte fokussiert. Zum anderen stellt seine birnen- 
förmige und nach links geneigte Körperhaltung einen deutlichen Kontrast zur 
geradlinigen Horizontal- und Vertikalstruktur des Hintergrunds dar. Farblich 
gesehen wird das vorliegende Bild vor allem durch einen Kalt-Warm-Kon- 
trast zwischen Grün- und Rottönen bestimmt. Aufgrund seiner völlig ‚farblo- 
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sen’ Kleidung nimmt der Sänger dazwischen eine neutrale Mittelposition ein. 
Insgesamt wirkt das Bild eher blass und hell, was eine Homologie zum Foto- 
gramm des Ruderers darstellt. 


Perspektivische Konstruktion 


In perspektivischer Hinsicht hat das Bild wenig Tiefenwirkung. Es handelt 
sich um eine „gestauchte“ Perspektive, die fotografisch durch die Verwen- 
dung starker Teleobjektive entsteht. Je stärker der Effekt der Stauchung des 
Raumes, desto weiter muss die Kamera von den abgebildeten Bildprodu- 
zent/inn/en entfernt sein. Aufgrund der parallel verlaufenden Linien im Hin- 
tergrund sind keine Fluchtpunkte rekonstruierbar. Beide Aspekte tragen dazu 
bei, den Sänger mit dem Hintergrund zu verbinden, worin auf dieser Ebene 
die Fokussierung besteht. 


Szenische Choreografie 


Der lachende Popstar Mustafa Sandal sitzt den Bildbetrachter/inne/n mit 
geöffneten Armen und geöffnetem Mund sowie lässig über die Knie herab- 
hängen Händen im Schneidersitz frontal gegenüber. Sein Kopf ist leicht seit- 
wärts und nach hinten gebeugt, seine Augen blicken nach rechts oben. Der 
Sänger ist im Bild zum einen dadurch fokussiert, dass er allein sitzt. Zum 
anderen stellt die Kombination aus seiner spezifischen Sitzhaltung und dem 
strahlenden Lachen eine spezielle Form der gestischen Steigerung dar. 


Ikonologische bzw. ikonische Interpretation 


Mustafa Sandal ist dadurch im Bild fokussiert, dass er allein sitzt und gleich- 
zeitig den Bildbetrachter/inne/n frontal zugewandt ist. Die Übergegensätz- 
lichkeit des Fotogramms besteht darin, dass der Sänger dabei sowohl geöff- 
net als auch verschlossen ist. Beispielsweise öffnet er sowohl die Arme als 
auch den Mund und verschließt zugleich die Beine. Er zeigt uns zwar sein 
Gesicht, aber wendet seinen Blick dabei ab. In diesem Zusammenhang er- 
scheint sein Mund in gewisser Weise als Hinweis auf eine Maskierung der 
Augen.” Im konkreten Fall erscheint das sympathische Lächeln des Sängers 
dazu geeignet sowohl eine gewisse persönliche Überlegenheit zum Ausdruck 
zu bringen als auch die Bildbetrachter/inne/n auf sympathische Weise von 


99 Im Alltag gelten die Augen als die wichtigsten Indikatoren dafür, ob jemand die Wahrheit 
spricht. 
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der Suche nach seinem wahren Gesicht (sowie von der genaueren Prüfung 
des Wahrheitsgehalts seiner Worte) abzubringen. 


9.6 Zur Relationierung der Fotogramme im Rahmen der 


Montage 
9.6.1  Reflektierende Interpretation von Einstellungswechsel und 
Montage 


Eine besondere Leistung der Montagetechnik des vorliegenden Musikvideos 
ist es, dass die drei untersuchten Hauptsequenzen zugleich auch eingelagerte 
Sequenzen darstellen und damit einander prinzipiell weder über- noch unter- 
geordnet sind. Dieser Montagestil wird in der Filmwissenschaft als Parallel- 
montage bezeichnet. Das Wesen der Parallelmontage'” ist es, zwei oder 
mehrere Handlungsstränge einander zeitlich gegenüberzustellen. Diese Ver- 
knüpfung kann durch die Verkürzung der Schnittfolgen intensiviert werden, 
was meist gegen Ende passiert, bevor sich die Handlungsstränge in einem 
gemeinsamen Punkt treffen. Die parallele Montage von Ferrari, Ruderer und 
Sänger stellt diesbezüglich sogar noch einen Spezialfall dar, denn die parallel 
dargestellten Handlungen stehen noch zusätzlich in einem antithetischen 
Verhältnis zueinander. In der Typologie von Wulff (2013) handelt es sich 
dabei um eine sogenannte Kontrastmontage; die Verknüpfung der Sequenzen 
„Ferrari“ und ,,Ruderer“ kann in weiterer Zuspitzung sogar als Kollisions- 
montage bezeichnet werden. Dadurch entsteht der Eindruck eines Wettren- 
nens, das auf die direkte Konfrontation der Kontrahenten hinausläuft. Der 
Sänger ist von diesem Duell ausgenommen. Ihm kommt die Rolle des Barden 
zu, der die Geschehnisse liedhaft kommentiert, sich aber selbst nicht ein- 
mischt — und kraft der Montage auch nicht einmischen kann!'”" Würde man 
das fahrerische Wettrennen im Musikvideo als sportliches Ereignis betrach- 
ten, so wäre der Sänger eher eine Art Livereporter als ein Schiedsrichter. 
Letzterer hätte nämlich zumindest die Möglichkeit, das Rennen zu starten 
oder zu beenden, was dem Sänger nicht möglich ist. Wie kann bei den drei 


100 Eine auf die Rezeption gerichtete Intention der Parallelmontage bestehe laut Rabiger (1998, 
S. 184) darin, die Zusehenden dazu zu bringen, nach Zusammenhängen zwischen prinzipi- 
ell unabhängigen Ereignissen (Personen, Orten, Handlungen) zu suchen. Durch diesen Me- 
chanismus entfalte die Parallelmontage nicht nur eine ästhetische, sondern auch ihre psy- 
chologische und politische Dimension. 

101 Hierin dokumentiert sich ein grundlegender Unterschied zwischen dem Handlungsspiel- 
raum eines Popsängers im Musikvideo und des Moderators einer TV-Show (z. B. „Istanbul 
Total“, Bohnsack, 2009; Hampl, 2010), der die Möglichkeit hat, den Ablauf der Ereignisse 
zu „dirigieren“ (Bohnsack, 2009, S. 215). 
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betrachteten Sequenzen „Ferrari“, „Ruderer“ und „Sänger“ jedoch überhaupt 
der Eindruck eines gemeinsamen Spielfeldes entstehen? 

Zur Herstellung einer räumlichen Verbindung zwischen den betrachteten 
Sequenzen reicht der Einsatz der Parallelmontage allein nicht aus. Dazu be- 
darf es der Präsentation von Einstellungen, in denen im Bild die gleichzeitige 
Anwesenheit der sonst räumlich getrennten Handlungsstränge an einem Ort 
zumindest ansatzweise sichtbar wird. Die Belege dafür dokumentieren sich 
im Video bzw. im Videotranskript (Abbildung 55). In der Sequenz „Sänger“ 
(Fotogramm 5) etwa wischt das Dach eines Autos durch das Bild, was signa- 
lisiert, dass der Sänger sich an einer befahrenen Straße befindet. In der Se- 
quenz „Ruderer“ (Fotogramme 31, 33-36, 39) sieht man den schlafenden 
Fischer (Fotogramme 21-23) im Hintergrund, wodurch dieser sich mit der 
Sphäre des Ruderers verbindet. Der Hund (Fotogramm 26) liegt auf der Stra- 
ße und wird knapp eine Minute später vom vorbeifahrenden Ferrari auf- 
geschreckt (Fotogramm 69), das Schiff (Fotogramm 29) taucht später in der 
Sequenz „Ruderer“ (Fotogramme 98-99, 107-108, 140-141) wieder entfernt 
im Hintergrund auf. 

Bohnsack (2009) bezeichnet mit Rückgriff auf Bordwell (1985) den 
Schauplatz des Geschehens, der durch Filme und Videos hergestellt wird, als 
montierten Raum (Bordwell, 1985, S. 117). Mit Souriau (1997) kann die 
durch die Montage der Sequenzen hergestellte Räumlichkeit auch als Diegese 
bzw. filmisches Universum bezeichnet werden. 

Sämtliche Sequenzen des vorliegenden Videos sind auf gleichzeitige Er- 
eignisse an einem einzigen Ort des Geschehens bezogen und werden im Mu- 
sikvideo auch durch den gemeinsamen Tonraum miteinander verbunden. 
Durch subtile visuelle Hinweise (etwa in Fotogramm 5: Das schemenhafte, 
kurze Durchs-Bild-Wischen eines Autos) und den gemeinsamen Tonraum 
entstehen wechselseitige Bezüge zwischen den Sequenzen, die am Ende auf 
den gemeinsamen Ort des Geschehens verweisen: Die gesamte Handlung 
spielt sich am Bosporus und in den Straßen der umliegenden Stadt Istanbul 
ab. Diese werden zur Arena der Wettkampfaustragung. Der einzige Ort, der 
außerhalb des Geschehens liegt und dennoch Bestandteil des Musikvideos ist, 
ist der Filmcountdown zu Beginn (Abbildung 55, Fotogramme 0 und 1). 
Wenngleich der Filmcountdown selbst nicht der physischen Welt entstammt, 
besteht seine paradoxe Eigenschaft darin, anzuzeigen, dass im Folgenden 
nicht die Realität, sondern ein Film gezeigt wird. Im folgenden Abschnitt 
möchte ich nun einige Überlegungen bezüglich der farblichen Relationen der 
drei untersuchten Sequenzen anschließen, die meines Erachtens zu einem 
tieferen Verständnis der Montage des vorliegenden Musikvideos beitragen 
können. 
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9.6.2  Reflektierende Interpretation von Farbkontrasten und 
Montagemustern 


Der im vorigen Abschnitt herausgearbeitete Befund der Kontrastmontage 
lässt sich auf der Ebene der Farbgebung der untersuchten Sequenzen weiter 
planimetrisch vertiefen. Wie der Blick auf das Videotranskript (Abbildung 
55) zeigt und auch die planimetrische Komposition der Fotogramme ver- 
deutlicht hat, sind in den einzelnen Sequenzen jeweils bestimmte Farben 
fokussiert. In der Sequenz „Ferrari“ ist es die Farbe Gelb, in der Sequenz 
„Ruderer“ Hellblau-Violett und in der Sequenz „Sänger“ Braun-Grün. Auch 
wenn sich diese Farben nicht in jedem Abschnitt dieser Sequenzen im selben 
Ausmaß dokumentieren, so bleibt die Zuordnung bestimmter Farben zu be- 
stimmten Sequenzen dennoch das gesamte Video hindurch bestehen. 

Wie die weitere Interpretation zeigen wird, ist die Zuordnung bestimmter 
Farben zu bestimmten Sequenzen alles andere als willkürlich. Laut Frost 
(2009) ist eine wohlüberlegte Farbstrategie für professionelle Film- und Vi- 
deoproduktionen unabdingbar, um den intendierten Ausdruckssinn formal zu 
unterstützen.” Uber die Auswahl der Farben für einen Film (oder ein Video) 
sollte laut Arnheim!” (1979, S. 51) und Frost (2009) bereits beim Verfassen 
des Drehbuchs Klarheit bestehen. Danach wäre seitens der abbildenden Bild- 
produzent/inne/en'™ sowohl während — durch Auswahl der konkreten Be- 
leuchtung und Kleidung der Abgebildeten — als auch nach den Aufnahmen — 
im Rahmen der Postproduktion bzw. Montage — auf die Einhaltung einer a 
priori festgelegten Farbstrategie zu achten. Im Vergleich zu allen anderen 
visuellen Gestaltungsstrategien zeichnen sich Farben durch die hohe Flexibi- 
lität ihrer Einsatzmöglichkeiten aus. Durch die Beeinflussung der Farbge- 
bung lassen sich laut Frost (2009) sowohl unterschwellige Atmosphären und 
Stimmungen erzeugen als auch bestimmte Aspekte im Film (Personen, Ge- 
genstände, Orte, Zeiten etc.) identifizierbar machen oder markieren. 

Ittens (2000, 2010) Auffassung nach steht keine Farbe für sich selbst, 
kann keine Farbe allein ein Geschehen bestimmen, sondern ist immer ver- 


102 In der Filmwissenschaft wird der Vorgang der sinnunterstützenden Farbkorrektur auch als 
„color-grading“ bezeichnet. 

103 Aufsatz von 1935 

104 Für die Farbgebung des Films oder Videos ist in der Regel der Kameramann bzw. cine- 
matographer oder director of photography (DP) gemeinsam mit dem Regisseur ver- 
antwortlich. Unter anderem aufgrund des hohen Stellenwerts der farblichen Unterstützung 
des intentionalen Ausdruckssinns für die professionelle Filmproduktion wechseln laut Frost 
(2009) berühmte Regisseure ihre Kameraleute so gut wie nie und arbeiten mit ihnen oft 
über Jahrzehnte zusammen (z. B. Steven Spielberg und Janusz Kaminski). 

105 So markiert etwa das blassrote Mäntelchen eines kleinen Mädchens im Schwarz-Weiß-Film 
„Schindler’s Liste“ (1993) eine Schlüsselszene. Filmausschnitt: http://www.youtube.com/ 
watch?v=j1VL-y9JHul 
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bunden mit anderen Farben, die mit ihr in größerem oder kleinerem Kontrast 
stehen. Ittens Theorie scheint nicht nur geeignet für die Interpretation von 
Einzelbildern und Fotogrammen, sondern insbesondere zur Interpretation der 
Montage. Sie fügt sich zudem in das Denken in Relationen und Komparatio- 
nen, wie es charakteristisch ist für die dokumentarische Methode. 

Die Interpretation des Einstellungswechsels im vorigen Absatz hat erge- 
ben, dass die Sequenzen „Ferrari“ (Abbildung 56) und „Ruderer“ (Abbildung 
60) zueinander in einem Kontrastverhältnis stehen. Dieses Kontrastverhältnis 
möchte ich mithilfe der Rekonstruktion der Farbkontraste nun im Anschluss 
empirisch definieren und differenzieren. Im Detail dokumentieren sich im 
Einstellungswechsel zwischen den beiden genannten Sequenzen nach Itten 
(2000, 2010) folgende Kontrastrelationen: 


1) Farbe-an-sich-Kontrast: Durch den Schnitt zwischen den Sequenzen 
„Ferrari“ und „Ruderer“ wird das Gesamtgeschehen des Musikvideos „bunt“ 
und „lebendig“. Der Farbe-an-sich-Kontrast entsteht prinzipiell durch das 
Vorhandensein der drei Grundfarben Rot, Gelb, Blau, ist jedoch auch in ab- 
geschwächter Form wirksam, wenn eine dieser Farben fehlt oder durch 
Mischfarben substituiert ist. Im vorliegenden Fall wird der Farbe-an-sich- 
Kontrast vor allem durch das satte Gelb des Ferraris lanciert, wobei die ande- 
ren Farben eher in den Hintergrund treten. Blau tritt in blasser Gestalt (Him- 
mel, Wasser) auf. Rot kommt (mit Ausnahme des nachträglich hinzugefügten 
Logos des TV-Senders NEV TV) fast gar nicht vor; mit Ausnahme der Ferra- 
rirücklichter (Abbildung 55, Fotogramm 24). Ansonsten ist der Farbe-an- 
sich-Kontrast im Fallmaterial nur aufgrund der blassen Sekundärfarbe Violett 
(Sequenz „Ruderer“) wirksam. 


2) Kalt-Warm-Kontrast: Am stärksten tritt dieser Kontrast zwischen den 
Polen Rot — Orange und Blau — Grün bzw. Blau — Türkis in Erscheinung. Im 
vorliegenden Fall ist jedoch auch dieser Kontrast eher schwach ausgebildet. 
Zwar ist das Gelb des Ferraris sehr satt und ohne Tendenz zum Grünlichen, 
d. h. zum Kalten. Das Hellblau-Violett der Ruderersequenz kippt jedoch sehr 
wohl ins Violett-Rötliche, d. h. ins Warme. Die Farben sind somit von ihrer 
Temperatur her eher neutral. Im Farbwechsel zwischen den Sequenzen ,,Fer- 
rari“ und „Ruderer“ dokumentiert sich folglich kein Kalt-Warm-Kontrast. 


3) Komplementär-Kontrast: Dieser Kontrast ist im Alltag der bekannteste. 
Die Farben Gelb und Violett, welche sich in den Sequenzen „Ferrari“ und 
„Ruderer“ wiederfinden, stellen klassische Komplementärfarben dar. Kom- 
plementärfarben schließen sich gegenseitig spektral vollständig aus und ste- 
hen deshalb auf Ittens Farbkreis direkt gegenüber. Der Komplementärkon- 
trast tritt am stärksten zwischen gesättigten Farben in Erscheinung. Im vor- 
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liegenden Fall ist der Komplementärkontrast abgeschwächt, da dem reinen 
Gelb des Ferraris nur das schwache Hellblau-Violett des Ruderers gegen- 
übersteht. 


4) Simultan(Sukzessiv)-Kontrast: Dieser Kontrast ist für das Verhältnis 
zwischen Ferrari und Ruderer im vorliegenden Fallmaterial als einer der 
wesentlichsten Kontraste anzusehen. Er verstärkt den Effekt aller bisher ge- 
nannten und folgenden Kontraste. Laut Itten (2000, 2010) bewirkt der Si- 
multan- bzw. Sukzessivkontrast, dass bleiche und neutrale Farbtöne in Ge- 
genwart gesättigter Farben in deren jeweiliger Komplementärfarbe erschei- 
nen. Im vorliegenden Fall führt der Simultan- bzw. Sukzessivkontrast dazu, 
dass die blassen Hellblau-Violett-Töne der Sequenz „Ruderer“ gegenüber der 
knallgelben Sequenz „Ferrari“ visuell in der Komplementärfarbe Violett 
angereichert werden, was letztlich den bereits festgestellten Komplementär- 
kontrast zwischen den beiden Sequenzen verstärkt. 


5) Quantitäts-Kontrast: Dieser Kontrast hängt mit der Tatsache zusammen, 
dass die Farben des Spektrums unterschiedliche Helligkeitswerte besitzen. 
Wie Itten (2000, 2010) in Bezug auf Goethes Farbenlehre (2003) erklärt, ist 
Gelb die hellste, Violett die dunkelste aller Farben. Ein markanter Hell-Dun- 
kel-Kontrast zwischen den Sequenzen wird im vorliegenden Fall vermieden, 
indem Violett auf das Helligkeitsniveau von Gelb angehoben ist. Da Violett 
durch Aufhellung jedoch seine Sättigung verliert, erscheint die Ruderer-Se- 
quenz zwangsläufig blass und farblos. 


Zusammenfassend ergibt sich anhand der analytischen Differenzierung der 
Farbkontraste im Zusammenhang mit den Einstellungswechseln zwischen 
den Sequenzen „Ferrari“ und „Ruderer“ folgender empirischer Befund: Ob- 
wohl die beiden Sequenzen fast dieselbe Helligkeit besitzen, entsteht auf- 
grund der Komplementärfarben Gelb und Violett ein farblicher Gegensatz 
zwischen ihnen. Dieses Verhältnis ist alles andere als ausgewogen. Es domi- 
niert der satte gelbe Ferrari über den blass-violetten Ruderer. In direkter Ge- 
genüberstellung mit der dritten Sequenz „Sänger“ wird deutlich, dass der 
gelbe Ferrari auch diese farblich überstrahlt. Hinsichtlich ihrer blassen Farb- 
gebung besteht damit eine augenscheinliche, aber auch formal rekonstruier- 
bare Homologie zwischen Sänger und Ruderer. In puncto Sättigung sind 
diese beiden Sequenzen dem bildfüllend präsentierten knallgelben Ferrari 
eindeutig untergeordnet. 

Bei differenzierter Betrachtung der Farbkontraste wird im vorliegenden 
Musikvideo durch die Montage folglich eine klare Hierarchie zwischen den 
drei untersuchten Sequenzen aufgeworfen, an deren Spitze die Sequenz ,,Fer- 
rari“ steht. Die farblich gesehen blasseren Sequenzen ,,Ruderer“ und „Sän- 
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ger“ sind dieser untergeordnet, wobei jedoch auch deren Verhältnis nicht 
völlig gleichwertig ist. Die Sequenz „Ruderer“ ist farblich als direkter kom- 
plementärer Gegenpart zur Sequenz „Ferrari“ konzipiert und in dieser Hin- 
sicht fokussiert. Demgegenüber steht die Sequenz „Sänger“ — in neutralen 
Farbtönen gehalten — scheinbar außerhalb dieses Farbduells. Dass dem nicht 
so ist, wird bei genauerer Betrachtung des Fotogramms 10 (Abbildung 55) 
deutlich, welches im Rahmen der Montage durch eine gleichwertige Über- 
blendung der Sequenzen „Ferrari“ und „Ruderer“ zustande kommt. 
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Abbildung 66: Farbverhältnisse der durch die Montage verbundenen Se- 
quenzen „Ferrari“, „Ruderer“ und „Sänger“ 
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Durch die Überblendung der beiden Sequenzen entstehen Grün- und Braun- 
töne sowie eine horizontale Gliederung des Bildes. Beides — Farbgebung und 
Planimetrie — weist starke Homologien zum Fotogramm der Sequenz „Sän- 
ger“ auf. Damit steht die Sequenz „Sänger“ formal gesehen keineswegs au- 
Berhalb des Geschehens, sondern kann durchaus als Synthese der aufgewor- 
fenen Gegensätze (gelb — violett, reich — arm etc.) aufgefasst werden. Zu- 
gleich verdeutlicht der Vergleich der beiden letzten Bilder nochmals, wie die 
Person des Sängers aufgrund ihrer etwas eigentümlichen Birnenform aus dem 
Ensemble der Mischfarben herausgehoben wird. 


9.7 Ikonologische bzw. ikonische Interpretation 


Auf den ersten Blick ist das vorliegende Musikvideo „Araba“ (1996) des 
türkischen Popstars Mustafa Sandal in hohem Maße durch die Polarität zwi- 
schen zwei antagonistischen Prinzipien bestimmt. Auf der Bildebene findet 
dies paradigmatisch durch die Komplementärfarben Gelb und Violett seinen 
Ausdruck, die in fester Koppelung mit den Sequenzen „Ferrari“ und „Rude- 
rer“ verbunden sind. In Kombination mit einer hohen Schnittfrequenz (teil- 
weise ein Schnitt pro Sekunde), die mit der Parallelmontage der Sequenzen 
einhergeht, vollzieht sich ein Feuerwerk an Reizwechseln, welches auch auf 
inhaltlicher Ebene seine Entsprechung findet: In der Eingangspassage des 
Musikvideos wird ein Wettrennen vorbereitet, das zwischen ungleichen Geg- 
nern in zwei Fortbewegungsarten zu Lande und zu Wasser ausgetragen wer- 
den soll. Ein PS-starker Ferrari tritt gegen einen einfachen Ruderer an. Be- 
dingt durch die dramaturgische Zuspitzung auf das farbliche und fahrerische 
Duell der beiden Kontrahenten fällt erst bei näherer Betrachtung auf, wie 
stark sie andere Teile des Videos maskieren und in den Hintergrund drängen 
— allen voran den eigentlichen Frontmann des Musikvideos, den türkischen 
Popstar und Sänger Mustafa Sandal. 


9.7.1 Exklusivität und Durchschnittlichkeit 


An sich ist Mustafa Sandal prominent ins Bild gesetzt: Gleich zu Beginn wird 
er als erste Person im Video eingeführt — und das sogar über einen ausge- 
dehnten Zeitraum von sechs Sekunden hinweg (Abbildung 55, Fotogramme 
2-7). Auch im weiteren Verlauf des Videos kommt er wieder vor (Abbildung 
55, Fotogramme 27-28). Außerdem wurde für ihn ein exklusiver Bildaus- 
schnitt gewählt: Der Sänger ist zentral, frontal, vollständig und symmetrisch 
ins Bild gesetzt, wodurch er auf der Ebene der Einstellung mehrfach fokus- 
siert ist. Wenn Personen im Bild allein und mittig abgebildet sind, verleiht 
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ihnen dies üblicherweise eine besondere visuelle Geltung.'” Hinzu kommt, 


dass der Sänger im Tonraum nahezu ständig über seine Stimme präsent ist. 

Paradoxerweise ist der Sänger aber trotz der erwähnten Mehrfachfokus- 
sierung weder auf der Ebene der Montage noch auf der Ebene der Einstellung 
bildbestimmend. Sein gesamter Auftritt hat den Gestus des Beiläufigen und 
Unauffälligen. Dies hat unter anderem mit seiner Körperhaltung, seiner Klei- 
dung und der Umgebung im Bild zu tun: Der Sänger sitzt in Alltagskleidung 
am Straßenrand vor einem formlosen und verblassten Hintergrund. Im Bild 
herrschen verwaschene Braun-, Grün- und Grautöne vor, die jenen Farben 
sehr nahe kommen, die sich aus der Überblendung der gelben Ferrari-Se- 
quenz mit der violetten Ruderer-Sequenz ergeben (Abbildung 66). Es hat den 
Anschein, als wäre der Sänger des Musikvideos seitens der abbildenden 
Bildproduzent/inn/en bewusst wohltemperiert und in aller (farblichen) 
Durchschnittlichkeit in Szene gesetzt. Doch worin liegt der tiefere Sinn die- 
ses Understatements? Immerhin handelt es sich im Falle des hier abgebilde- 
ten Bildproduzenten um einen der bekanntesten und erfolgreichsten türki- 
schen Popstars. 


9.7.2 Teilhabe und Distanzierung 


Möglicherweise erhöht die zurückhaltende Präsentation den Status des Sän- 
gers Mustafa Sandal über einen Umweg, indem sie als vornehme Zurückhal- 
tung aufgefasst werden kann: Als erfolgreicher Popstar hat man es nicht 
nötig, sich an selbstwerterhöhenden Wettkämpfen zu beteiligen. Anstatt sich 
im sportlichen Wettkampf selbst die Hände schmutzig” zu machen, kann 
Mustafa Sandal es sich somit leisten, von der Bühne bzw. Tribüne aus zuzu- 
sehen. Dies dokumentiert sich im Bild konkret darin, dass der Sänger es sich 
entspannt auf erhöhtem Platz über dem Straßenniveau'® gemütlich gemacht 
hat. Von dort aus kann er das bunte Treiben am Bosporus gut überblicken. 
Zusammenfassend ist die eingenommene Mittelposition des Sängers zwi- 
schen den anderen beiden Sequenzen bzw. Handlungssträngen als ein beson- 
deres Außen zu verstehen, welches dem Sänger — im Sinne einer Übergegen- 


106 Im Rahmen der gattungsimmanenten und gattungsübergreifenden komparativen Analyse 
der TV-Show „Istanbul Total“ habe ich die mittige Positionierung des Moderators im Bild 
als typisches Merkmal von Late-Night-Shows im Fernsehen herausgearbeitet (Kap. 5.2.1). 
Diese Art der Positionierung kann nach Bohnsack (2009, S. 240) sogar als Hinweis für eine 
„Monostrukturierung“ der Sendung durch den abgebildeten Bildproduzenten/die abgebil- 
dete Bildproduzentin und als „Hyperzentrierung“ auf dessen/deren Person gewertet werden. 

107 Diese hängen in Abbildung 60 locker herab, während sie Ruderer und Ferrarifahrer an ihren 
(Sport-) Geräten haben. 

108 Dies dokumentiert sich im Video durch die vorbeifahrenden Autos 
(Abbildung 55, Fotogramm 5). 


194 


sätzlichkeit — zugleich Teilhabe und Distanzierung sowie ein gleichzeitiges 
Dabeisein und Darüberstehen ermöglicht. 

Homolog zu dieser Übergegensätzlichkeit zeigt sich der Sänger nicht, 
wie dies etwa in seinen anderen Musikvideos'” der Fall ist, auffälliger ge- 
kleidet und pompöser, d.h. für einen großen Popstar standesgemäß: Seine 
spezielle Mittlerposition würde nämlich durch knalligere Farben bzw. ausge- 
fallenere oder elegantere Kleidung korrumpiert. Im Falle einer kräftigeren 
Farbgebung würde sich automatisch der Kontrast zwischen dem Sänger und 
den anderen beiden Sequenzen erhöhen, wodurch der zentrale Gestus des 
Musikvideos, welcher in der Dramatisierung des Duells zwischen Ferrari und 
Ruderer liegt, zerstört würde. Spielte der Sänger eine aktivere Rolle in die- 
sem Geschehen, stünden sich plötzlich drei anstatt nur zwei Parteien in der 
Wettkampfarena am Bosporus gegenüber. Nach den Regeln der Kombinato- 
rik hätte diese kleine Veränderung durchaus große Konsequenzen. Sie würde 
die Komplexität des antizipierbaren Wettkampfausgangs drastisch erhöhen. 
Während bei einem Duell prinzipiell davon auszugehen ist, dass der Bessere 
gewinnt, ist das Ergebnis eines Triells (d.h. eines „Duells“ von drei Personen) 
nicht klar vorhersehbar.''° Durch seinen vornehmen Rückzug auf die Ränge 
der Austragungsarena bzw. seinen Rang als Popstar wird dieses drohende 
Szenario entschärft. Indem sich der Sänger der direkten, potentiell gefahr- 
vollen Auseinandersetzung entzieht, erhält er zugleich ein höheres Maß an 
Kontrolle über das Geschehen. Von seinem bequemen Sitzplatz aus kann der 
Sänger Mustafa Sandal nun die Ereignisse aus sicherer Distanz beobachten 
und (musikalisch) kommentieren — wohl wissend, wer letztlich als Sieger 
hervorgeht, wenn sich die zwei anderen vor seiner Nase streiten.""' 


9.7.3 Gesicht und Körperlichkeit 


Es passt zur rekonstruierten besonderen Rolle Mustafa Sandals im Video, 
dass er — im Gegensatz zu Ruderer und Ferrarifahrer — den Bildbetrach- 
ter/inne/n stets frontal zugewandt ist. Wie ein Blick auf die betrachteten Se- 
quenzen bzw. das Videotranskript (Abbildung 55) verdeutlicht, ist der gelbe 
Ferrari zwar am häufigsten und überaus prominent ins Bild gesetzt, der Fah- 
rer des Ferraris ist dabei jedoch zumindest in diesem Transkriptausschnitt 
kein einziges Mal zu sehen. Er wird als Person nur über die Indexikalität 


109 Bspw. „Pazara Kadar“, „Indir“, „Allmy Life“ etc. 

110 Beispielsweise kann auch ein schwächerer Gegner mit relativ hoher Wahrscheinlichkeit ein 
Triell gewinnen, wenn sich die beiden stärkeren Gegner gegenseitig eliminieren. 

111 An dieser Stelle besteht noch eine interessante Homologie zur Denkfigur bzw. dem mathe- 
matischen Problem des Triells. Paradoxerweise geht nämlich beim Triell tatsächlich der 
schwächste Gegner mit höchster Wahrscheinlichkeit als Sieger aus der Konfrontation her- 
vor. 


195 


seiner Hände am Lenkrad (Fotogramme 37 und 39) konstituiert. Erst durch 
diesen Kunstgriff kann in weiterer Folge (mithilfe der Montage) im Video 
überhaupt der rekonstruierte Wettkampf zwischen zwei menschlichen Kon- 
trahenten aufgebaut werden.'' 

Im Kontrast zum Ferrarifahrer tritt der Ruderer im Bild weit sichtbarer in 
Erscheinung. In Parallelmontage werden auch seine Hände gezeigt (Abbil- 
dung 55, Fotogramm 38), um auf der Ebene der szenischen Choreografie den 
direkten Vergleich zum Ferrarifahrer herzustellen. Über weite Strecken hin- 
weg ist aber ebenfalls der restliche (bekleidete) Körper des Ruderers in Halb- 
totale (Abbildung 60) zu sehen. Ähnlich wie der Ferrarifahrer entzieht er sich 
dabei aber dem direkten Blick der Bildbetrachter/innen: Der Ruderer ist 
ihnen zu keinem Zeitpunkt frontal zugewandt, sondern stets nur von hinten 
oder von der Seite zu sehen. 

Die Person des Sängers hingegen sitzt scheinbar unverstellt vor uns und 
verleiht dem Musikvideo ein menschliches Gesicht (Abbildung 64). Dieses 
Gesicht hält der Popstar Mustafa Sandal frontal in die Kamera. Daneben ist 
auch sein restlicher (bekleideter) Körper in Totalaufnahme vollständig er- 
kennbar. Echte Nahaufnahmen des Gesichts werden vermieden. Ein Grund 
dafür könnte sein, dass Mustafa Sandal durch eine solche Detailfokussierung 
seine bisher im Video rekonstruierte übergegensätzliche Mittlerposition ver- 
lieren würde. Obwohl das Gesicht des Sängers nie in Nahaufnahme zu sehen 
ist, demonstriert es eine große Bandbreite an Ausdrucksmöglichkeiten (vgl. 
Abbildung 55): von abwesend unbeteiligt (Fotogramme 2-4) über lachend 
(Fotogramme 5-7) bis zu nachdenklich (Fotogramme 27-28). Dieser Reich- 
tum an Mimik haucht Mustafa Sandal — insbesondere in direkter Gegentiber- 
stellung zu den zwei anderen Akteuren bzw. Sequenzen des Videos — Leben 
bzw. eine Seele ein. Seine schlichte Kleidung und die zentral-frontale Kame- 
raeinstellung tragen weiter dazu bei, dass er menschlich und alltäglich (auf 
Augenhöhe) erscheint. Dadurch kann er leichter zur Identifikationsfigur für 
die Bildbetrachter/innen werden. 


9.7.4 Akteure und deren Extensionen 


Die anderen untersuchten Protagonisten (Ruderer und Ferrarifahrer) sind 
nicht nur aufgrund ihrer körperlichen Abgewandtheit bzw. Verhüllung 
schwerer zugänglich. '"? Sowohl der Ruderer als auch der Ferrarifahrer stellen 


112 Würden die Hände des Fahrers am Lenkrad fehlen, so könnte im vorliegenden Musikvideo 
auch der Eindruck entstehen, dass es sich beim Ferrari um einen computer- oder fernge- 
steuerten Gegner wie in der populären Science-Fiction-Serie Knight Rider handelte. 

113 Bei genauer Betrachtung haftet ihnen im Bild auch ein gewisses Stigma der Prothesenab- 
hängigkeit an. Was wären sie ohne ihre maschinenartigen Krücken? 
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im Latourschen Sinne (2008) „Hybridakteure“''* dar: Sie werden letztlich 
über ihre technischen Prothesen Ruderboot und Ferrari definiert, mit deren 
Hilfe sie sich fortbewegen bzw. präsentieren. Der Sänger kommt als Einziger 
ohne technische Hilfsmittel aus. Dafür ist er an seinen Sitzplatz gebunden. 

Im Zusammenhang mit den Denkfiguren von Hybridakteuren und von 
Instrumenten stellt sich des Weiteren die Frage, ob Mustafa Sandals leere 
Handflächen — im Kontrast zu den beschäftigten Händen des Ferrarifahrers 
und Ruderers — nicht noch auf andere (fehlende) Instrumente verweisen. In 
Anbetracht seiner musikalischen Fähigkeiten wäre in dieser Sitzposition 
durchaus vorstellbar, dass Mustafa Sandal ein Musikinstrument, wie eine 
Gitarre oder eine kleine Trommel, hält. Das Fehlen auch dieser „Geräte“ 
verweist darauf, dass er keinerlei technische Hilfsmittel braucht. Sein eigent- 
liches Instrument ist unsichtbar; es ist die Stimme. Im Video kann die Stim- 
me des Sängers auf der Bildebene nur durch den Gesichtsausdruck re- 
präsentiert werden, was wiederum erklärt, warum sein Gesicht — im Gegen- 
satz zu den Gesichtern der anderen Akteure — gleich zu Beginn des Musikvi- 
deos zu sehen ist. Doch mit Ausnahme des herzhaften Lachens bewegen sich 
die Mundwinkel des Sängers nicht. Er singt nicht, sondern bleibt stumm. 
Worauf wartet Mustafa Sandal? 


9.7.5 Warten auf die Stellvertreter 


Die ersten vierzig Sekunden des Musikvideos „Araba“ haben die Funktion 
darzustellen, wie die untersuchten Akteure sich und ihre Geräte in Bereit- 
schaft versetzen. Dabei werden gleichzeitig die qualitativen Unterschiede 
zwischen den Protagonisten herausgearbeitet. Der Sänger ist ab dem ersten 
Fotogramm bereit. Mit seinem unsichtbaren Instrument — der Stimme — hat er 
seinen Platz eingenommen und macht keinerlei Anstalten, ihn zu räumen. Er 
sitzt unverrückbar in seiner Position, schaut und lacht, während Ferrarifahrer 
und Ruderer erst Hand an ihre Fortbewegungsgeräte legen müssen, um sie in 
Bereitschaft zu versetzen. Durch die Parallelmontage wird räumliche Nähe 
zwischen den Protagonisten hergestellt: Der Sänger sitzt an einer befahrenen 
Straße, die vermutlich am Ufer des Bosporus liegt. Mustafa Sandal wartet 
also, bis die anderen so weit sind. 

Der Umstand, dass Mustafa Sandal nicht einfach zu singen beginnt, be- 
vor die anderen Handlungsakteure (Ferrarifahrer und Ruderer) entsprechend 
eingeführt sind, verdeutlicht, dass diese für die Präsentation seiner eigenen 
Person offensichtlich erforderlich sind. Der von ihnen ausgetragene Wett- 
kampf, der gesellschaftliche Dimensionen gewinnt, tangiert ihn nicht. Er 
positioniert sich jenseits von Arm und Reich, jenseits des Wettkampfes von 


114 vgl. auch Schäffer (2001, S. 54). 
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Selbstpräsentationen, die sich einerseits auf die Authentizität eigener Mus- 
kelkraft und andererseits auf PS-Stärke und Status-Symbole stützen. Dabei 
scheint die rekonstruierte Gesichtslosigkeit von Ferrarifahrer und Ruderer 
anzuzeigen, dass es sich in ihrem Falle nicht um reale, sondern imaginierte 
Stellvertreter handelt. In diesem Zusammenhang entwickelt das Warten des 
Sängers eine kontemplative Qualität und verweist — hinter der ruhigen Ge- 
sichtsfassade — auf eine lebhafte psychische Auseinandersetzung in seinem 
Inneren. Diese innere Auseinandersetzung ist in ähnlicher Weise wirksam 
und unsichtbar wie das ephemere Ausdrucksinstrument seiner Stimme.''” Das 
bescheidene und zurückhaltende Auftreten des Sängers korrespondiert mit 
einer bunten und kontrastreichen Innenwelt, die ihn psychisch beschäftigt 
und von der Außenwelt trennt. Wie das Musikvideo suggeriert, können dieje- 
nigen, die es oft genug sehen und diesen komplexen Mechanismus entschlüs- 
seln, zur Belohnung hinter Mustafa Sandals äußerer Versunkenheit einen 
tieferen Einblick in die Seele des Popstars erhaschen. 


9.7.6 Die Pose des Geschichtenerzählers 


Jemand, der eine reiche Innenwelt hat, hat auch viel zu erzählen — insbeson- 
dere dann, wenn er sitzt. Der Schneidersitz ist in vielen Kulturkreisen als 
konventionalisierte Körperhaltung fürs Geschichtenerzählen verbreitet. Zwar 
wird und wurde diese Pose aus kulturhistorischer Perspektive auch für Hand- 
arbeitstätigkeiten, zum Musizieren und Meditieren etc. eingenommen, keiner 
dieser Aspekte dokumentiert sich jedoch im vorliegenden Material. Auf his- 
torischen und zeitgenössischen Abbildungen sind Geschichtenerzähler häufig 
in sitzender Haltung abgebildet, die jener von Mustafa Sandal ähnlich ist. 

Der Begriff der Pose wurde bereits früh im Rahmen der dokumentari- 
schen Bildinterpretation aufgegriffen und hat in diesem Zusammenhang bis 
heute hohe Relevanz für die Interpretation der Leistungen abgebildeter Bild- 
produzent/inn/en (insbesondere von deren Gesten und Gebärden) gehabt 
(Bohnsack & Przyborski, 2014; Bohnsack, 2001b, 2009). 


115 In diesem Sinne könnten das Gesicht des Sängers und seine leeren Hände auch als die 
äußeren Projektionsflächen seiner innerer Stimmungen und Konflikte gewertet werden. 
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Abbildung 67: Der Geschichtenerzähler, „Verstehen und Gestalten“, 
Oldenbourg, München, Beate Speck-Kafkoulas 


Die Pose des Schneidersitzes (vgl. Abbildung 67), bei der die Beine immobi- 
lisiert und entlastet sowie die Hände frei sind, scheint für den Geschichtener- 
zähler besondere Vorteile aufzuweisen. Zum einen ist diese Sitzposition 
komfortabel, zum anderen können die Hände gestikulativ zur Unterstreichung 
der Erzählung eingesetzt werden. Für Sänger ist das Sitzen eher eine untypi- 
sche Haltung, da dabei nicht das volle Stimmvolumen zur Geltung gebracht 
werden kann. Bohnsack und Przyborski (2014) bezeichnen einen derartigen 
habituellen Bruch bei der Einnahme einer Körperhaltung als „De-Kontextuie- 
rung“, welche sie als „Konstituens der Pose“ ansehen. 

Als weiterer Bruch im Sinne einer De-Kontextuierung könnte gewertet 
werden, dass Mustafa Sandal in der Pose des Geschichtenerzählers schweigt. 
Anstelle von Worten bedient er sich kontrastreicher Bilder. Bisher konnten 
wir rekonstruieren, dass die Geschichte von Ferrarifahrer und Ruderer nicht 
abgekoppelt von der Person des Sängers existiert, sondern offenbar seine 
eigene Lebensgeschichte oder zumindest Lebensthemen von persönlicher 
Relevanz und zugleich von potentieller Relevanz für das Publikum oder Mi- 
lieus innerhalb dessen porträtiert. Die bildervermittelte Narration ließe sich 
folgendermaßen paraphrasieren: Mustafa Sandal, der millionenschwere Su- 
perstar, sitzt in einfacher Kleidung am Straßenrand und fragt sich tief in sei- 
nem Herzen, ob es erfolgversprechender sei, Reichtümer und Luxus zu ge- 
nießen oder sich durchs Leben zu kämpfen. Zum Beweis der Aufrichtigkeit 
dieser Geschichte zeigt uns der Sänger sein Gesicht und seine bloßen Hände. 
Doch sein abgewandter Blick, die verdeckten Handflächen und das Lachen 
(Abbildung 64) lassen Zweifel an der vorgegebenen Aufrichtigkeit entstehen. 
Der abgewandte Blick und die verdeckten Handflächen können als Hinweise 
dafür aufgefasst werden, dass der Sänger etwas verbergen will. Dies gibt 
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seinem Lachen den Gestus eines wissenden Lachens, eines Lachens, das auf 
einem Informationsvorsprung gegenüber den Bildbetrachter/inne/n und dem 
Amiisement über die geschickte Inszenierung und deren Posenhaftigkeit 
beruht. Der Geschichtenerzähler steht jenseits dieser Inszenierungen. Die 
bemerkenswerte Botschaft des schelmischen Lachens von Mustafa Sandal 
scheint in diesem Zusammenhang wiederum von unglaublicher Offenheit 
geprägt zu sein: Traue nicht dem, was du siehst! Er steht über dem Posieren 
und der Selbstinszenierung dieser Milieus und über den zwischen ihnen aus- 
getragenen Kämpfen. Und hierin liegt möglicherweise gerade der Schlüssel 
für seine Popularität. 


9.7.7 Die Übergegensätzlichkeit von Authentizität und Inszenierung 


Die zusammenfassende Übergegensätzlichkeit des Musikvideos „Araba“ 
(1996) besteht somit im schelmischen Spiel von Authentizität und Inszenie- 
rung. Der Sänger Mustafa Sandal entpuppt sich als sympathischer Trickster, 
der durch seinen diskreten Auftritt die Zusehenden einerseits von sich ablenkt 
und andererseits auf sich aufmerksam macht, ihre Aufmerksamkeit geradezu 
bannt. Als einzige Person, die ihr Gesicht zeigt und dabei vollkommen sich 
selbst genügt, wird er zur zentralen Identifikationsfigur des Videos. Seine 
äußerliche kontemplative Ruhe gegenüber den sichtbar energiegeladenen 
Wettkampfsequenzen der anderen Akteure löst Spekulationen über seine 
inneren Konflikte aus. Im Mechanismus der evozierten Anteilnahme an sei- 
nem persönlichen Befinden avanciert sein Gesicht zum Echtheitszertifikat, in 
dem sich die Frage nach seiner Aufrichtigkeit kristallisiert. Was sollen wir 
von seinem legeren und unaufgeregten Auftritt halten? Immerhin ist Mustafa 
Sandal ein millionenschwerer Popstar. Diese Zuschreibung wird durch die 
abbildenden Bildproduzent/inn/en systematisch unterbunden, indem sie alles, 
was mit Reichtum, Luxus und Protz verbunden ist, mit dem gelben Ferrari im 
Bild assoziieren. Diesem gegenüber wird Mustafa Sandal durch die mit ihm 
assoziierten Grün-, Braun- und Grautöne rein formal schon als bescheiden 
porträtiert. Als die größte Leistung der abbildenden Bildproduzent/inn/en ist 
es in diesem Zusammenhang anzusehen, dass es ihnen gelingt, eine mehr- 
deutige Zuschreibungsspirale in Gang zu setzen, die letztendlich sicherstellt, 
dass für die Zusehenden kein Weg an der Person des Popstars Mustafa San- 
dal als abgebildetem Bildproduzenten vorbeiführt. Dieses System ist derma- 
Ben ausgefeilt, dass selbst der mimische Hinweis des Sängers, bei dem Mu- 
sikvideo würde es sich um ein inszeniertes Posieren handeln, letztendlich 
wieder auf ihn selbst zurückverweist. Zusammenfassend könnte man sagen, 
dass dies alles dazu beiträgt, die Marke Mustafa Sandal in der Popszene fest 
zu verankern und erfolgswirksame Folgekommunikationen in den Zielgrup- 
pen auszulösen. 
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Zum Abschluss dieser Videointerpretation erhellt dieser letzte Befund sogar 
noch zwei weitere Aspekte des Videos, die zuvor nicht recht zu deuten wa- 
ren. Zum einen möchte ich abschließend noch einmal auf den Filmcount- 
down bzw. — in der Sprache der Filmwissenschaft — das sogenannte Start- 
band zurückkommen, das gleich zu Beginn des Videos zu sehen ist. Es wurde 
im Zusammenhang mit der Rekonstruktion der Diegese des Films als Bruch 
mit dem restlichen Video rekonstruiert, ohne dass dieser Bruch bisher näher 
erörtert oder erklärt werden konnte. Das Startband dient bei der traditionellen 
Projektion von Spielfilmen in Kinosälen zur Synchronisation von Bild und 
Ton sowie zur Einrichtung des Bildausschnitts. Für ein Musikvideo, das über 
das Fernsehen oder im Internet verbreitet wird, ist der Einsatz eines Startban- 
des jedoch völlig überflüssig und funktionslos. Die einzige Funktion des 
Filmcountdowns im vorliegenden Musikvideo besteht in dem indexikalen 
Hinweis, dass nun ein Film folgt. Denselben Hinweis geben im Verlauf des 
gesamten Videos die schwarzen Balken, die sogenannte Letterbox, an der 
Ober- und Unterkante des Bildes. Auch Letterboxes erfüllen ihre technische 
Funktion nur bei der TV-Ausstrahlung von Kinofilmen. Somit suggerieren 
sie, dass es sich im Falle des Musikvideos „Araba“ (1996) um einen Spiel- 
film handle. Wie die Interpretation des Fallmaterials jedoch deutlich gemacht 
hat, kann auch diese Zuschreibung ihrerseits nur als letztes Mosaiksteinchen 
jener komplexen Inszenierung aufgefasst werden, die das gesamte Musikvi- 
deo bestimmt. 
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Abbildung 68: CD-Cover der Single ,,Araba“ (2004) für den internationalen 
Markt, Polydor, Universal Music Group, Quelle: 
http://www.7digital.com/artist/mustafa-sandal/release/araba-2 


Schon beim Vergleich der CD-Covers der Single „Araba“ von 2004 (Abb. 
68) und 1996 (Abb. 54) dokumentieren sich deutliche Gemeinsamkeiten und 
Unterschiede. So ist in beiden Fallen sowohl die perspektivische Information 
als auch die Farbpalette deutlich reduziert. Auf Ebene der szenischen Chore- 
ografie ist der Sänger Mustafa Sandal jeweils mit abwärts geneigtem Kopf 
abgebildet. Wahrend er jedoch in der urspriinglichen Bildversion die Betrach- 
ter/innen keck anblickt und ihnen aktiv seine Hand entgegenstreckt, sind 
seine Augen in der aktualisierten Variante geschlossen, sodass er selbst pas- 
siver wirkt und so eher zum Gegenstand (voyeuristischer) Betrachtung wer- 
den kann. 
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10 „Araba“ (2004): Die Version für den internationalen 


Markt 
10.1 Auswahl des Fallmaterials zur komparativen Analyse 


In einer Episode von „Istanbul Total“''° (Kap. 5) wird der türkische Popsän- 


ger Mustafa Sandal eingeladen, um eine neue Version seines Musikvideos 
„Araba“ (vgl. Kap. 0) zu präsentieren. Während des Interviews erklärt der 
Sänger, dass dieses Musikvideo eigentlich auf einem alten Song, „Araba“ (zu 
Deutsch: „Auto“), basiere, welcher 1996 in der Türkei''’ einer seiner größten 
Erfolge gewesen sei. Nachdem er einen Vertrag mit der deutschen Musik- 
firma Polydor (Teil der Universal Music Group''®) abschließen konnte und 
2003 mit einem weiteren Lied „Aya Benzer“ („Mondlicht“) die Top Ten der 
deutschen Musikcharts erreichte, entschloss sich Polydor 2004 ,,Araba“ in 
einer Neuauflage auf den internationalen Markt zu bringen. Wie Mustafa 
Sandal weiter erklärt, beinhaltete dies auch die Produktion eines neuen Mu- 
sikvideos: „Das alte Video für ,Araba‘ hätte in Deutschland gewiss nicht 
bestanden. Also drehten wir ein neues in Berlin.“ Was die Auswahl des Fall- 
materials für dieses Kapitel betrifft, wurden beide Versionen des Musikvi- 
deos für eine komparative Interpretation herangezogen. 

Abbildung 55 zeigt das Videotranskript der ersten vierzig Sekunden der 
Originalversion des Musikvideos ,,Araba“ von 1996, das für den türkischen 
Binnenmarkt produziert wurde.''” Abbildung 69 zeigt dieselbe Art von Vi- 
deotranskript für das Musikvideo ,,Araba“, das 2004 für den internationalen 
Markt neu gedreht wurde.'” Bevor ich auf die formulierende Interpretation 
der zwei Videoversionen eingehe, möchte ich die Aufmerksamkeit auf deren 
formale Kompositionen bezüglich Schnitt bzw. Montage lenken. 


116 Ausstrahlung am 12. Mai 2004. 

117 Der Musikfirma Sony Music France zufolge wurden ca. 2.000.000 Kopien des Albums 
„Araba” verkauft. 

118 Zusammen mit Sony Music Entertainment und der Warner Music Group ist die Universal 
Music Group eine der drei sogenannten ,,Hauptlabels“. Hauptlabels sind die größten Unter- 
nehmen der Musikindustrie, die den weltweiten Markt für populäre Musik kontrollieren. 

119 Link zur türkischen Version des Videos: http://www.youtube.com/watch?v= 
bOm8YPF3N70 

120 Link zur internationalen Version des Videos: http://www.youtube.com/watch?v= 
QlvPQbYKLww 
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Passage (oder Sequenz): Eingangspassage 

Film (oder Video): „Araba“ (2004) für den internationalen Markt 
Dateiname: http://www.youtube.com/watch?v=QIvPQbYKLww 
Datum: 2004 

Time Code: 0-233 

Dauer: 3:53 Min. 

Transkription: Stefan Hampl 


Te 


0 sec. 1 sec. 


Text 
Te 


Text 
Te 


Text 
Te 


37 sec. 


Text 


Abbildung 69: Videotranskript von „Araba“ (2004), Universal Music Group 
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10.2 Die Rekonstruktion der Montage der Musikvideos 
„Araba“ 1996 und 2004 


Wie in dieser Arbeit bereits erläutert und demonstriert, lässt sich das Video- 
material von Fernsehshows Bohnsack (2009) in eine hierarchische Struktur 
von Hauptsequenzen, Untersequenzen und eingelagerten Sequenzen unter- 
teilen. Dem Segmentierungsprozess folgend können repräsentative Standbil- 
der und Fotogramme ausgewählt und mit den Werkzeugen der komparativen 
Bildinterpretation detailliert analysiert werden. Aufgrund der hohen Zahl von 
Aufnahmen und Schnitten fordern Musikvideos die skizzierte Standardpro- 
zedur der Videointerpretation erheblich heraus. Wie die Videotranskripte der 
Musikvideos (Abbildung 55 und Abbildung 69) zeigen, können in beiden 
Videoversionen schon während der ersten vierzig Sekunden ungefähr zwan- 
zig Schnitte ausgemacht werden. Obwohl es möglich ist, eine wörtliche Be- 
schreibung der einzelnen Aufnahmen sowie die Segmentierung vorzuneh- 
men, sträubt sich das Videomaterial gegen alle Versuche, es überzeugend in 
Bezug auf Haupt-, Unter- oder eingelagerte Sequenzen zu beschreiben. 

Bohnsack (2009, S. 158) nennt zwei wesentliche Argumente für die 
Notwendigkeit der Entwicklung empirischer Werkzeuge zur Direktinterpre- 
tation der Montage: Wie bereits in Kapitel 2.2 erwähnt, ist nach Auffassung 
der Filmwissenschaften (z. B. Mikos, 2003; Pudowkin, 1996; Wiedemann, 
2005) die Montage das zentrale Alleinstellungsmerkmal von Film und Video 
(bspw. ggü. Fotografien). Des Weiteren stellt die Montage „eindeutig das 
Produkt der Leistungen der abbildendenden Bildproduzent/inn/en dar“ und 
eröffnet uns dadurch den exklusiven „Zugang zu deren modus operandi“ 
(Bohnsack, 2009, S. 162). 

Zur Einführung in die Interpretation des Montageprozesses ist es wichtig, 
daran zu erinnern, dass in den ersten vierzig Sekunden beider zur Analyse 
herangezogener Videoversionen ungefähr zwanzig Schnitte ausgemacht wer- 
den können. Diese Anzahl verweist auf eine hohe Dichte von Schnitten; bei 
genauer Betrachtung der Videotranskripte (Abbildung 55 und Abbildung 69) 
sind die Schnitte aber nicht gleichmäßig verteilt. Tatsächlich ist bei beiden 
Videos die Zeit zwischen den Schnitten am Anfang länger und gegen Ende 
der Sequenzen kürzer. Die zunehmende Dichte der Schnitte kann laut 
Mikunda (2002) durch professionelle Montagetechniken des Preluding er- 
klärt werden: Als Basisbestandteile von visuellem Geschichtenerzählen müs- 
sen Orte und Charaktere zu Beginn vorgestellt werden, was Zeit erfordert. 
Nachdem der Begriff Prelude schon aus der Musik abgeleitet wurde, lohnt 
sich auch Betrachtung der Musikspur der Videos — analog zu den visuellen 
Entwicklungen am Bildschirm beginnt die Musik mit einer langsamen Melo- 
die, bevor sie energetisch und rhythmisch wird. In Abbildung 55 vollzieht 
sich diese Veränderung der Musikgeschwindigkeit bei 29 Sekunden, in und 
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Abbildung 69 bei 17 Sekunden. Wie den Videotranskripten entnommen wer- 
den kann, werden die Schnitte in beiden Videoversionen nach diesem audio- 
visuellen Intro häufiger. Damit können die ersten Brüche in den zwei Video- 
versionen als jene identifiziert werden, die das Vorstellen der zentralen Cha- 
raktere und Orte von deren weiterer Interaktionsentwicklung trennen. In der 
Folge möchte ich die Intros der beiden Videoversionen nun bezüglich ihrer 
formalen Kompositionen näher vergleichen. 


10.2.1 Montage als Ausdruck von Farbkontrasten 


Um die komplexe Montage von Musikvideos zu verstehen, ist es hilfreich, 
die Farbbeziehungen der Aufnahmen, d. h. die Montagemuster, die sich in 
den „Farbkontrasten“ (Itten, 2000, 2010) der Videos ausdrücken, zu rekon- 
struieren. In dieser Hinsicht können Videotranskripte (wie die in Abbildung 
55 und Abbildung 69 dargestellten) als systematisch arrangierte Farbpalletten 
verstanden werden. Um die Farbkontraste, die sich während einer Film- oder 
Videobearbeitung herausgebildet haben, zu rekonstruieren, wird der Fokus 
nicht auf den Inhalt, sondern vorerst nur auf die formalen Farbsequenzen 
gelegt. Farben sind dadurch, dass sie visuelle Bedeutungen in Bezug auf 
Farbschattierung, Helligkeit und Sättigung aussenden, das umfassendste 
Mittel zur Schaffung von Atmosphären in Filmstreifen.'*! Beim ersten, ober- 
flächlichen Blick auf die Videotranskripte scheint Abbildung 55 viel farben- 
froher und auch heller als Abbildung 69. Warum ist das so? Diese Frage führt 
zu einem weiteren Untersuchungsschritt, der die Farbbeziehungen der Video- 
versionen mit Ittens Farbkontrasttheorie in Einklang bringt. Hier wird die 
komplette Liste der sieben Farbkontraste nach Itten (2000, 2010) angeführt: 


Farbe-an-sich-Kontrast 
Hell-Dunkel-Kontrast 
Kalt-Warm-Kontrast 
Komplementär-Kontrast 
Simultan-Kontrast 
Qualitäts-Kontrast 
Quantitäts-Kontrast 


a Eee 


Farbe-an-sich-Kontrast 
Im Rückgriff auf unseren ersten Eindruck von den zwei Musikvideos kann 


das Konzept der Farbkontraste dazu benutzt werden, die türkische und die 
internationale Version von „Araba“ systematisch zu unterscheiden. Die Fra- 


121 Nach Seitz (2010) sind Spielfilme nach Genre farbkodiert. 
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ge, ob ein Video bunt ist oder nicht, kann beantwortet werden, indem der 
Farbe-an-sich-Kontrast der Montage betrachtet wird. Nach Itten (2000, 2010) 
ist der Farbe-an-sich-Kontrast der einfachste Farbkontrast. Um ihn in Er- 
scheinung treten zu lassen, müssen mindestens drei helle und voll gesättigte 
Farben vorliegen. Anderenfalls verschwindet der Effekt zwar nicht, wird aber 
verringert. Der Farbe-an-sich-Kontrasts ist am ausdrucksstärksten, wenn die 
drei Primärfarben Rot, Gelb und Blau zum Einsatz kommen. Zusätzlich kann 
der Effekt dadurch verstärkt werden, dass die Farben voneinander durch 
weiße oder schwarze Linien getrennt werden. Diesen differenziellen Richtli- 
nien folgend, qualifiziert sich Abbildung 55 als ein gutes Beispiel des Farbe- 
an-sich-Kontrastes, obwohl es nicht alle Kriterien für diesen Kontrast erfüllt. 
Die intensivste Einzelfarbe im Video ist helles Gelb, das durch schwarze und 
weiße Formen verstärkt wird. Zudem gibt es hellrote Flecken und hellblaue 
wie auch hellviolette Bereiche; Violett kann als Mischfarbe identifiziert wer- 
den (eine Mischung aus den Primärfarben Rot und Blau). Im Gegensatz dazu 
beinhaltet Abbildung 69 Kontraste zweier Sekundärfarben (Orange und 
Grün) mit einigen Flecken der Primärfarben Rot und Gelb, während die Pri- 
märfarbe Blau überhaupt nicht aufscheint. Demzufolge hat Abbildung 55 
einen hohen Farbe-an-sich-Kontrast, Abbildung 69 einen niedrigen. 


Hell-Dunkel-Kontrast 


Durch ihren Zusammenhang mit der Helligkeit von (bewegten)Bildern, 
schaffen die „Farben“ Schwarz und Weiß überaus starke Kontraste. Bei der 
Interpretation dieses Farbkontrasts kommt es aber nicht nur rein auf die Prü- 
fung des Vorhandenseins von hell und dunkel an, sondern vielmehr die ge- 
naue Betrachtung der Beziehungen zwischen hellen und dunklen Aspekten. 
In dieser Hinsicht lenkt Itten (2000, 2010) die Aufmerksamkeit auf einen 
Umstand, dessen wir uns normalerweise nicht bewusst sind, der aber schon 
1810 von Goethe (2003) entdeckt wurde: Jede gesättigte Farbe hat ein unter- 
schiedliches Helligkeitsniveau (z. B. ist Gelb die hellste, Violett die dun- 
kelste Farbe). Beim Vergleich der zwei Videotranskripte scheint das von 
Abbildung 55 wie bei Tag aufgenommen, das von Abbildung 69 bei Nacht. 
Auf globalem Montagelevel ist Abbildung 55 hell, Abbildung 69 dunkel. 
Trotzdem ist der Kontrast zwischen hell und dunkel in Abbildung 69 stärker, 
denn in der dunklen Umgebung gibt es auch helle Lichtflecken. 


Kalt-Warm-Kontrast 
Der Kalt-Warm-Kontrast stellt einen Zusammenhang zwischen Farbe und 
damit verbundenen Temperaturen oder Temperaturveränderungen her. Nach 


Itten (2000, 2010) kann Orange-Rot als die „wärmste“, Grün-Blau als die 
„kälteste‘“ Farbe definiert werden. Beim Vergleich der zwei Musikvideotran- 
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skripte kann konstatiert werden, dass der Kalt-Warm-Kontrast in Abbildung 
55 kaum in Erscheinung tritt, während er in Abbildung 69 durch die Kom- 
plementärfarben Orange-Rot und Grün zu Tage tritt. 


Komplementär-Kontrast 


Auf Ittens zwölfteiligem Farbkreis, welcher eine analytische Zusammenstel- 
lung von konzentrisch angeordneten Primär-, Sekundär- und Tertiärfarben ist, 
stehen sich Komplementärfarben direkt vis-a-vis gegenüber. Die Vermi- 
schung dieser Farben auf Papier ergibt eine neutrale grau-schwarze Farbe; 
ihre Synchronüberlagerung auf dem Bildschirm produziert weißes Licht 
(Itten, 2010, S. 49). Die Kombination von Aufnahmen in Komplementärfar- 
ben durch Montage hebt die Schnitte zwischen ihnen hervor. Beide Video- 
transkripte sind jeweils durch einen einzigen Komplementärkontrast charak- 
terisiert. In Abbildung 55 ist es der Kontrast zwischen Gelb und Violett; in 
Abbildung 69 der Kontrast zwischen Rot und Grün. 

Mittlerweile dürfte deutlich geworden sein, dass mit Ittens Konzept der 
Farbkontraste Beziehungsprofile von Farbkompositionen gefasst werden 
können, die für die Rekonstruktion des Dokumentsinns von Filmen und Vi- 
deos nützlich sind. Der Komplementärkontrast von Gelb und Violett (Abbil- 
dung 55) neigt immer dazu, auch einen Hell-Dunkel-Kontrast hervorzurufen, 
weil Gelb dreimal heller ist als Violett. Im Beispiel von Abbildung 55 kann 
dieser Effekt nur durch eine Desaturierung der Farbe Violett im Montagepro- 
zess verringert werden. Die Komplementärfarben Rot und Grün (Abbildung 
69) befinden sich im Vergleich dazu hinsichtlich ihrer Helligkeitswerte auf 
derselben Stufe und sind damit gleichwertig. Rot und Grün können, unab- 
hängig vom Grad ihrer Sättigung, potentiell einen Kalt-Warm-Kontrast initi- 
ieren. Dies ist in Abbildung 69 beobachtbar. Da alle Farbkontraste miteinan- 
der zusammenhängen, ist es nicht möglich, dass ein Bild bzw. ein Film oder 
Video in allen Kontrastdimensionen hohe Werte erreicht. Diese Tatsache 
spricht aber gerade für die differenzielle Analyse von Farbkontrasten und 
ihren Einsatz als differenziertes Instrument der Bild- und Videointerpretation. 


Simultan-Kontrast 


Der Simultan-Kontrast kommt beim Auftreten von neutralen Graubereichen 
neben gesättigten Farben zum Tragen. Unter Bezugnahme auf physiologische 
Reaktionen im menschlichen Auge erklärt Itten (2000, 2010), dass eigentlich 
neutrale Graubereiche in bei der Anwesenheit gesättigter Farben in der je- 
weiligen Komplementärfarbe erscheinen. Dieser Effekt wird weder in Abbil- 
dung 55 noch in Abbildung 69 deutlich, kann aber in Aufnahmen gefunden 
werden, die zwar nicht neutral grau, aber zumindest ungesättigt sind. In Ab- 
bildung 55 zum Beispiel verursacht der Simultan-Kontrast die Verstärkung 
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der Komplementärfarbe des ungesättigten Violetts (z. B. Einzelbilder 11-14; 
18-23). 


Qualitäts-Kontrast 


Die Sättigung legt den Grad der Farbenreinheit und -intensität fest. Ittens 
(2000, 2010) Definition zufolge sind die Farben, die durch optische Lichtbre- 
chung von weißem Licht erzeugt werden, am gesättigsten. Die Voraussetzung 
für das Auftreten dieses Kontrasts ist, dass gesättigte Farben zusammen mit 
ungesättigten (dumpfen) Farben dargestellt werden. Damit der Effekt wirk- 
sam wird, müssen die gesättigten und ungesättigen (dumpfen) Farben jedoch 
dieselbe Farbschattierung aufweisen (z. B. muss gesättigtes Rot räumlich 
oder zeitlich neben ungesättigtem Rot auftreten). Wenn unterschiedliche 
Farbschattierungen kombiniert werden, tritt der Qualitäts-Kontrast gegenüber 
anderen Kontrasten in den Hintergrund. Da dieser Effekt eher dezent ist, kann 
er in Abbildung 55, die großteils von starken Farbkontrasten dominiert wird, 
kaum ausgemacht werden. Abbildung 69 hingegen demonstriert die unter- 
schwellige Macht des Qualitäts-Effektes geradezu beispielhaft: In Abwesen- 
heit von starken Farbkontrasten und durch die „Ein-Tönigkeit‘“ der bearbei- 
teten Aufnahmen erfolgt beispielsweise eine Verstärkung der rosa Farbe des 
Kleides der Frau und ihrer Lippen'”” vor dem ungesättigten Hintergrund. 


Quantitäts-Kontrast 


Dieser letzte Farbkontrast bezieht sich auf die unterschiedliche Leuchtkraft 
einzelner Farben, die 1810 in Goethes „Theorie der Farben” (2010) beschrie- 
ben wurde: Gelb = 9, Orange = 8, Rot = 6, Violett = 3, Grün = 6. Diese Zah- 
len oder Farbwerte sind mit dem Raumbedarf von Farben verbunden. Gelb 
(Farbwert 9) braucht zum Beispiel dreimal weniger Platz als Violett (Farb- 
wert 3); die Komplementärfarben Rot und Grün brauchen gleich viel Platz 
(beide mit einem Farbwert von 6). Was die von den Videotranskripten einge- 
fangene Montage betrifft, erklärt dies das häufigere Aufkommen von Cuts in 
dem Musikvideo für den türkischen Markt (Abbildung 55). Im Vergleich zu 
den hellvioletten Aufnahmen (Sekunden 18-23) „erweitern“ die großen gel- 
ben Aufnahmen (z. B. Sekunden 17-19) den Bildschirmraum. Die roten und 
grünen Aufnahmen der Musikvideos für den internationalen Markt (Abbil- 
dung 69) hingegen haben den gleichen räumlichen Bedarf und sind daher 
gleichwertig. 


122 Wenn die Frau später im Video in einer Szene mit starker Grünfärbung (Sekunden 17-19 in 
Bild 2) auftritt, erscheint das pinke Kleid strahlend weiß, während die rosa Lippen auf Rot 
umgeschminkt werden müssen, damit sie in der komplementären Farbumgebung dunkel 
aussehen. 
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10.2.2 Vorikonografische und ikonografische Interpretation 


Mit der Orientierung an der Methodologie der dokumentarischen Methode ist 
es bei der Beschreibung des visuellen Inhalts von (sich bewegenden) Bildern 
essenziell, die vorikonografische von der ikonografischen Ebene als Teile der 
formulierenden Interpretation zu unterscheiden. Die ikonografische Ebene 
kommt unseren alltäglichen Kommunikationsmitteln am nächsten. Auf dieser 
Interpretationsebene können wir Beschreibungen von Szenarien und Men- 
schen dadurch erschaffen, dass wir sie in unseren eigenen Bedeutungssyste- 
men kontextualisieren. In Abbildung 69 können wir beispielsweise eine jun- 
ge, förmlich angezogene Frau erkennen, die in einem feinen Restaurant war- 
tet und die Aufmerksamkeit eines Mannes auf sich zieht, der sie von einem 
anderen Tisch aus beobachtet. 

Wenn wir nur die vorikonografische Information, die in dieser Abbil- 
dung enthalten ist, berücksichtigen, „sehen“ wir nur eine Frau, die an einem 
von vielen Tischen sitzt, und einen Mann, der in die Kamera blickt. Die Dif- 
ferenzierung zwischen vorikonografischer und ikonografischer Information 
ist in zweifacher Hinsicht nützlich: Zum einen trägt sie dazu bei, dass das, 
was die Forschenden (persönlich) in den Interpretationprozess einbringen, 
systematisch identifiziert und kontrolliert werden kann. Zum anderen hilft sie 
aber auch dabei, gerade diese Anteile bewusst für die Interpretation nutzbar 
zu machen. Insofern erlaubt uns die Unterscheidung zwischen vorikonografi- 
scher und ikonografischer Information, das Phänomen der „media literacy“ 
(Mikunda, 2002) auch empirisch zu untersuchen. Im vorliegenden Fall ist 
von Interesse, wie es durch Montage gelingt, den Zuschauer/inne/n einen 
kohärenten Sinn zu vermitteln, obwohl im Video nur kleine Bruchstücke von 
Ereignissen gezeigt werden. 

Da ich die Vorgehensweise bei der formulierenden Interpretation (auf 
vorikonografischer und ikonografischer Ebene) in dieser Arbeit anhand von 
Fallmaterial bereits ausführlich erläutert habe, möchte ich zum Schluss nun 
direkt zur reflektierenden Interpretation übergehen. 


10.2.3 Szenische Choreografie und Montage 


Laut Bohnsack (2009, S. 39) und Imdahl (1996, S. 19) fokussiert die Logik 
des Konzepts der szenischen Choreografie darauf, zu erwägen, wie sich die 
Menschen (oder Objekte) vor der Kamera (die dargestellten Bildprodu- 
zent/inn/en) zueinander und zu den Zuschauer/inne/n verhalten. Während die 
Rekonstruktion von szenischer Choreografie typischerweise im Rahmen der 
Interpretation einzelner Standbilder (Fotogramme) oder Aufnahmen ange- 
wandt wird, kann das Konzept auch auf die Montageebene ausgeweitet wer- 
den. Im letzteren Fall werden Menschen nicht länger als sich in einem physi- 
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schen Raum bewegend, sondern als sich in einem „editing space“ (Bordwell, 
1985, S. 117) oder einem „montierten Raum“ bewegend verstanden. 
Bohnsacks (2009, S. 164) Darstellung von Hickethier (2012) zufolge ist die 
Kreierung eines „filmischen Raumes“ jenseits des physischen Raumes tat- 
sächlich eines der Schlüsselmerkmale von Film und Video, welches diese 
Medien von anderen visuellen Medien, wie z. B. der Fotografie, absetzt. Ich 
werde mich nur auf diejenigen essenziellen Aspekte der szenischen Choreo- 
grafie konzentrieren, die für die ikonische Interpretation (Bohnsack, 2009; 
Imdahl, 1996) der zwei Musikvideos benötigt werden. 


a) „Araba” für den türkischen Markt 


Wie in Abbildung 55 zu sehen ist, beginnt das „Araba“-Video für den türki- 
schen Markt mit einem Countdown (Sekunden 0-1), gefolgt von einem sit- 
zenden Mann (dem Sänger), der den Zuschauenden lachend zugewandt ist. In 
Fotogramm 5 fährt ein gelber Ferrari schnell vorbei, der in den Fotogrammen 
7 bis 10 genauer anvisiert wird. Als Nächstes (11-14) sehen wir einen Mann, 
der von den Zuschauenden weggeht und mit seiner Hand an einem Skullboot, 
einem Ruderboot für eine Person, entlangstreicht. Von Fotogramm 15 bis 
Fotogramm 17 wird der gelbe Ferrari wieder in der Frontalansicht dargestellt, 
bevor der Ruderer sich reckt und streckt (18-20). Als Nächstes sehen wir 
einen Fischer aufwachen und seine Baseballmütze etwas von seinem Gesicht 
hochheben; dann wieder den Ferrari (24-25), einen auf der Straße liegenden 
Hund (26), den Sänger (27-28), den Bug eines großen Schiffes, das eine 
große Welle vor sich über den Bildschirm schiebt (29-30); den Ruderer, der 
auf das Meer schaut und mit dem Rücken zu den Zuschauer/inne/n steht (31); 
den Ferrari (32), den Ruderer, wie er seine Mütze abnimmt (33); den Ferrari 
(34), den Ruderer, wie er seinen Pullover auszieht (35-36); zwei Männer- 
hände am Steuerrad des Ferraris (37); den Ruderer, wie er seine Beine auf 
dem Skullboot ausstreckt (38); wieder zwei Hände am Steuerrad des Ferraris 
(39). 

Die ersten vierzig Sekunden des Musikvideos „Araba“ für den türkischen 
Markt (Abbildung 55) können als Vorbereitung der beiden Hauptcharaktere 
für eine Wettfahrt zusammengefasst werden. Die zwei Protagonisten sind der 
Ruderer und der Fahrer des Ferraris. In Fotogramm 42 geht eine bis hierher 
nicht identifizierbare Frau in einem weißen Kleid durch das Bild, welche in 
Fotogramm 48 die Wettfahrt dadurch startet, dass sie die Hände über ihrem 
Kopf zusammenklatscht. Ab diesem Moment rudert der Ruderer energisch 
den Bosporus entlang, während der Ferrarifahrer mehrere Hindernisse des 
Verkehrs in Istanbul umgehen muss. Ihr gemeinsames Ziel ist eine Insel in 
der Mitte des Bosporus, wo die junge Frau verzweifelt auf das Erscheinen 
einer der beiden Männer wartet. Zwischen den Szenen sehen wir ausführliche 
Aufnahmen des tanzenden und singenden Sängers. Während des Großteils 
des Videos kann der Fahrer des gelben Ferraris nicht gesehen werden. Die 
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Geschichte endet damit, dass der Ruderer die Insel erreicht und der Frau in 
die Arme fällt (270-272). Der Ferrari kommt am Ufer zum Stehen (273- 
274); der Ruderer und die Frau drehen sich um, als sich die Tür des Wagens 
öffnet (275-277). Die Kamera schwenkt herum und zeigt die braune Hose 
des Fahrers, sein weißes Hemd und am Ende sein Gesicht (278-281). Wäh- 
rend der letzten Sekunden des Videos schaut der Ferrarifahrer in die Kamera, 
bevor er sich dann wegdreht (282-289). Am Ende wird klar, dass Fahrer, 
Ruderer und Sänger ein und dieselbe Person sind. 


b) „Araba“ für den internationalen Markt 


In Abbildung 69 wird die szenische Choreografie des Musikvideos „Araba“ 
für den internationalen Markt folgendermaßen präsentiert: Zu Beginn sitzt 
eine junge Frau mit dunklem Haar und einem rosafarbenen Kleid alleine an 
einem Restauranttisch (Fotogramme 0-1). Dann sehen wir den Kopf eines 
Mannes (des Sängers) und den einer Frau (vielleicht seine Freundin oder 
Ehefrau) im Profil. Er singt, sie sieht zu ihm auf (2-7). Anschließend können 
wir die Frau im rosafarbenen Kleid von weiter weg sehen; die leeren Tische 
um sie herum werden sichtbar (8-16). Zur gleichen Zeit werden drei junge 
Mädchen von hinten gezeigt, die rhythmisch in einem Nachtklub tanzen. Im 
Restaurant sitzt die Frau noch immer an ihrem Tisch (20). Ein Kellner 
kommt zu ihr und serviert ihr Wasser (22-33). In der Zwischenzeit sitzt der 
Sänger im selben Raum an einem anderen Tisch mit drei anderen Menschen: 
einer Frau (derselben wie in den Fotogrammen 2-7) und zwei männlichen 
Freunden (z. B. Fotogramme 21 und 24). Als der Kellner das Wasser serviert, 
wird der Sänger auf die einsame Frau im pastellfarbenen Kleid aufmerksam 
(29). Nachdem der Kellner den Tisch verlassen hat, können wir das Gesicht 
des Sängers und das Dekolleté (37, 42-43) sowie das Gesicht der Frau (38, 
44) sehen. In Fotogramm 45 betritt der Freund der Frau die Szene und geht 
zu ihrem Tisch. Während sich das Gesicht des Sängers der Kamera zuwendet, 
setzt sich der Freund, gerade mit jemand anderem telefonierend, hin. Die 
Frau im pastellfarbenen Kleid ist unglücklich über die Unhöflichkeit ihres 
Freundes, akzeptiert sie aber und bleibt weiter sitzen (50-63), während der 
Sänger den Kellner bezahlt (59). Ein Szenenwechsel zeigt wieder die drei 
jungen, hüftenschwingenden Mädchen (64). Als Nächstes betritt der Sänger 
mit seiner Freundin und seinen Freunden den Nachtklub und singt (65-77). 
Zurück im Restaurant sehen wir das Paar gerade anstoßen (78), als eine ver- 
ärgerte junge Frau an den Tisch tritt (79-81). Leute drehen sich um (82); der 
Freund schaut verwundert drein (83). Als die verärgerte Frau ihren Ring in 
sein Champagnerglas wirft, entpuppt sie sich damit als seine Verlobte (85- 
86). Zur gleichen Zeit nähert sich der Sänger im Nachtklub der Bar und geht 
an verschiedenen tanzenden Mädchen vorbei (89-92). Die Verlobte verlässt 
das Restaurant. Der Freund versucht die Situation zu erklären, aber die Frau 
im rosa Kleid steht ebenfalls auf und geht (93-96). Als Nächstes erscheint 


214 


die Frau im selben Nachtklub (97-99). Sie sieht ihn singend an der Bar ste- 
hen (100-102) und geht Richtung Toiletten. Während er weiter singt, tanzen 
verschiedene junge Mädchen und blicken in die Kamera, die Frau wischt ihre 
Tränen weg (118-119), rückt ihr Dekolleté zurecht und kommt zurück in den 
Tanzsaal. Dort versucht sie sich dem Sänger zu nähern, doch der wird durch 
eine Gruppe tanzender Mädchen von ihr getrennt (130-153). Sie sieht ihn 
dann wieder an der Bar (154-155), aber er geht weg (156). Sie bleibt an der 
Bar stehen und schaut irritiert (157-158). Er schaut noch einmal zu ihr zu- 
rück (159-160), bevor er sich seiner Freundin zuwendet (161-163). Wieder- 
um werden tanzende Mädchen gezeigt (164-171), die Frau findet den Sänger 
wieder und schaut ihn gebannt an (172-188). Während weiter getanzt wird 
und der Sänger in der Ecke — und damit in der Nähe seiner Freundin - bleibt 
(189-201), beginnt die Frau irgendwann auch zu tanzen (202-205). Am Ende 
tanzen der Sänger und die Frau beide scheinbar glücklich, aber getrennt von- 
einander und die Party geht weiter. In den letzten Sekunden tauschen der 
Sänger (228) und die Frau (229) einen letzten Blick, beide genau in die Ka- 
mera schauend. Die Augen der Frau schließen sich, dann wird ausgeblendet. 


10.3 Ikonologische bzw. ikonische Interpretation 


Das „Ikonische” kann mit Imdahl (1996) als Bedeutungsessenz, als genera- 
tive Struktur des rekonstruierten Dokuments verstanden werden. In diesem 
letzten Interpretationsschritt werden die Ergebnisse der vorherigen Stufen 
miteinander in Beziehung gesetzt. Das Hauptziel der ikonologischen und 
ikonischen Interpretation ist es, zu einer abschließenden Schlussfolgerung zu 
gelangen, die von allen Interpretationsebenen unterstützt wird. Mit der kom- 
parativen Analyse der zwei Musikvideos zu ,,Araba“ wurde ein komplexes 
und herausforderndes Informationsgebilde bezüglich biografischer Brüche 
und ihrer „Reparatur“ herausgearbeitet. Der dokumentarischen Methode 
folgend werden nun zuerst Gemeinsamkeiten diskutiert, bevor auf die Unter- 
schiede eingegangen wird. Diese Vorgehensweise offenbart die empirischen 
Verbindungen zwischen den Fällen, die sonst den Alltagsinterpretationen 
überlassen werden. 


10.3.1 Farbkontraste 


Es gibt nur einen Farbkontrast, den die beiden Videoversionen gemeinsam 
haben: den Komplementär-Kontrast. In Abbildung 55 wird er durch die Far- 
ben Gelb und Violett ausgedrückt, in Abbildung 69 durch den Kontrast von 
Rot und Grün. Die dazwischenliegenden Cuts werden durch komplementär- 
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farbene Aufnahmen hervorgehoben. Während in Abbildung 55 fast jeder 
Schnitt mit dieser Methode hervorgehoben wird, ist das in Abbildung 69 nur 
bei zwei ausgewählten Cuts der Fall (Sekunden 17-19). Die geringere An- 
zahl von Komplementär-Kontrasten im Musikvideo für den internationalen 
Markt erzeugt generell eine viel homogenere Atmosphäre. Der Homogeni- 
tätsgedanke dokumentiert sich auch auf dem Niveau der Farbleuchtkraft 
(Itten, 2000, 2010): Im Wesentlichen ist Gelb eine viel hellere Farbe als ihre 
Komplementärfarbe Violett. Rot dagegen ist genauso hell wie Grün. Im 
Grunde macht das die Wechsel zwischen komplementärfarbenen Einstellun- 
gen der „Araba“-Version für den internationalen Markt unauffälliger als in 
der Version für den türkischen Markt. 

Der Farbe-an-sich-Kontrast ist einer der stärksten Farbkontraste in Ab- 
bildung 55, da fast alle Primärfarben und einige Sekundärfarben anzutreffen 
sind. Zusammenfassend lässt sich daher sagen, dass die Version für den tür- 
kischen Markt von sehr lebendigen und hellen Farben beherrscht wird. Die 
Farben sind sehr „laut“, was noch durch die Dominanz des Quantitäteffekts 
unterstrichen wird. Durch die Montage kann kaum ein stärkerer „Farb- 
schock“ (Mikunda, 2002) ausgelöst werden als durch die Vollbildansicht des 
knallgelben Ferraris. Dies erzeugt ein signifikantes strukturelles Ungleichge- 
wicht im Video, das durch die komplementärfarbenen Gegenaufnahmen und 
den ständigen Wechsel zwischen den Aufnahmen ausbalanciert wird. Im 
Sinne Imdahls (1996) kann dieser Mechanismus als Übergegensätzlichkeit 
bezeichnet werden. Auf der einen Seite wird der Effekt der gelben Farbe 
durch das Aufscheinen ihrer Komplementärfarbe reduziert; auf der anderen 
Seite verstärkt in der darauffolgenden Aufnahme das Vorhandensein der 
Komplementärfarbe die Dominanz des Gelben sogar noch. Auf ikonischer 
Ebene repräsentiert dies den Kampf gegen einen fast unbesiegbaren Feind. 

Auf der Ebene von Farbkontrasten illustriert Abbildung 69 einen anderen 
Zugang: Keine Farbe wird hier aktiv und unübersehbar in den Vordergrund 
gestellt. Dies lässt eine viel dezentere, aber sogar noch effektivere Farbein- 
stellung zu. Eine allgemeine Lichtreduzierung ist der effektivste Weg, dieses 
Ergebnis zu erreichen. Indem das Setting vom hellen Tageslicht nach drinnen 
verlegt wird, kann bei der Bearbeitung die Verstärkung und Reduzierung von 
Licht effektvoll eingesetzt werden. Anstatt nur den Farbe-an-sich- und den 
Qualitäts-Kontrast in einer hellen, sonnenbeleuchteten Atmosphäre differen- 
zierend einsetzen zu können, war es den Herausgebern der „Araba“-Version 
für den internationalen Markt durch die Lichtreduzierung möglich, die 
Scheinwerfer in einer vielseitigeren und weniger auffälligen Art und Weise 
auf spezifische Farben zu richten und bestimmte Aspekte des Szenarios in 
den Mittelpunkt zu stellen. 
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10.3.2 Szenische Choreografie im Verhältnis zu Farbkontrasten 


Die Protagonisten der ,,Araba“-Version für den türkischen Markt (Abbildung 
55) sind mit einer spezifischen Farbanordnung assoziiert: Der Ruderer ist in 
eine hellviolette oder hellblaue Umgebung eingebettet, während der Ferrari- 
fahrer von der gelben Farbe seines Autos umgeben und repräsentiert wird. 
Zwischen diesen beiden Umgebungen hin und her zu wechseln, ist — nicht 
nur auf der Farbebene, sondern auch auf dem Level der sozialen Klasse und 
des materiellen Wohlstandes — möglich. Im Vergleich dazu können sich die 
Protagonist/inn/en der „Araba“-Version für den internationalen Markt (Ab- 
bildung 69) an ihre (Farb-)Umgebungen anpassen und auch zwischen ihnen 
wechseln. Dadurch werden rein formal — im Gegensatz zur türkischen Ver- 
sion — keine expliziten Klassenunterschiede aufgeworfen. Die Grenzen zwi- 
schen den „sozialen Welten“ des Sängers und der Frau im pastellfarbenen 
Kleid sind durchlässig und machen eine Begegnung auf Augenhöhe möglich. 
Auf farblicher Ebene findet dieser Aspekt durch die ausgewogene Mischung 
der Komplementärfarben Grün und Rot seinen Ausdruck. 


10.3.3 Biografische Brüche von Männern und Frauen 


Im Musikvideo „Araba“ für den türkischen Markt beruht der biografische 
Bruch für die Frau in ihrem Hin- und Hergerissensein zwischen zwei mitei- 
nander konkurrierenden Männern oder zwei konkurrierenden Seiten eines 
Mannes.” Von einer Insel im Bosporus aus initiiert die Frau das Schlussren- 
nen zwischen den Männern. Der eine Konkurrent ist durch seinen gelben 
Ferrari, einem Merkmal für Wohlstand und Luxus, charakterisiert. Der ande- 
re ist durch das Rudern über den Bosporus gekennzeichnet, welches harte 
Arbeit und physische Kraft symbolisiert. Der Bruch geschieht vor allem auf 
der Ebene der formalen Komposition (z. B. durch starke Farbkontraste). 
Dennoch gibt es auch einen explizit artikulierten Bruch zwischen den zwei 
Rivalen, nämlich jenen hinsichtlich sozialer Klasse und Einkommen. Brüche 
in der „Araba“-Version für den türkischen Markt sind somit eher universeller, 
gesellschaftlicher Natur. Nur für die Frau, die erwartet, dass es zu einer Ent- 
scheidung kommt, ist der Bruch biografisch relevant. 

In der „Araba“-Version für den internationalen Markt gibt es keinen ex- 
pliziten Bruch in der Gesellschaft. Obwohl argumentiert werden könnte, dass 
es einen Bruch in der Persönlichkeit des untreuen Freundes gibt, kann das 
nicht für alle Männer im Video generalisiert werden. Der Sänger beispiels- 
weise wird als Mann mit einer integren Persönlichkeit porträtiert. Im Gegen- 


123 Wenn der Sänger noch mitgerechnet wird, könnte sogar behauptet werden, dass der Haupt- 
darsteller drei miteinander konkurrierende Seiten hat. 
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satz zur „Araba“-Version für den türkischen Markt ist er vom biografischen 
Bruch der Frau mitbetroffen. 


10.3.4 Araba (1996): Der Mann im existentiellen Kampf mit sich 
selbst 


In der „Araba“-Version für den türkischen Markt rettet der Mann, der sich 
mit ganzer Kraft für die Frau einsetzt, die Beziehung. Indem er harte Arbeit 
und Schweiß wählt, um seine Liebste auf der Insel zu erreichen, entscheidet 
er sich gegen Luxus und Oberflächlichkeit, gegen schicke Autos und feine 
Kleidung. Seine Entscheidung stellt eine Konsolidierung der romantischen 
Liebesbeziehung dar, die aufgrund der demonstrierten Ambiguität seines 
Charakters auf dem Spiel stand. Am Ende fällt die Frau ihrem Liebsten in die 
Arme. Als sie dem inneren Rivalen des Mannes in den Abschlussszenen 
gegenüberstehen, kommt ein Funken Zweifel im Paar auf, aber indem sich 
der Ferrarifahrer von ihnen wegdreht, wird die Situation besiegelt und die 
Beziehung gerettet. 

Was die Darstellung der Frau im Musikvideo betrifft, ist erwähnenswert, 
dass sie zwar den Wettkampf der beiden Charaktere initiiert, aber keine akti- 
ve Rolle bei dessen Entscheidung spielt. Die Beziehung des Paares steht im 
Grunde nie wirklich auf dem Spiel. Sie wird weiterbestehen, egal welches der 
konkurrierenden Persönlichkeitsmerkmale des Mannes gewinnt. Im Video 
würde die Frau sich jedem möglichen Ergebnis fügen, solange nur die Ambi- 
guität des Mannes ein Ende findet. Ihre Rolle der machtlosen Zuschauerin 
wird durch das Auftreten des Sängers Mustafa Sandal ergänzt, der einerseits 
außerhalb des Ereignisablaufs agiert (indem er nur über sie singt), anderer- 
seits aber auch noch die Rolle der zwei männlichen Hauptfiguren spielt und 
daher das gesamte Video beherrscht. Abschließend lässt sich sagen, dass 
dieses indirekte Mittel der Situationskontrolle von einer Außenposition aus 
als bemerkenswerte Analogie zu der im Video skizzierten Rolle der Frau 
angesehen werden kann. Die Hauptaussage in Hinblick auf psychische Hei- 
lung und Konsolidierung der Persönlichkeit ist hier, dass Männer aktive Ent- 
scheidungen treffen sollten, um ihren Partnerinnen bei der Lösung ihrer Prob- 
leme zur Seite zu stehen. Den Frauen ihrerseits kommt der Part zu, bei den 
Männern den psychischen Konsolidierungsprozess indirekt zu initiieren, 
indem sie den emotionalen Druck auf sie erhöhten (z. B. durch die Zurschau- 
stellung von Unglücklichsein und Leiden). Die Beziehung in die Brüche 
gehen zu lassen und allein zu sein, ist weder für die Männer noch die Frauen 
eine Option. Dies ist ein signifikanter Unterschied zur internationalen Versi- 
on des Musikvideos. 
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10.3.5 Araba (2004): Die enttäuschte Frau sublimiert ihre Begierde 


In der „Araba“-Version für den internationalen Markt ist es die Frau, die die 
Beziehung beendet, nachdem sie von der Untreue ihres Geliebten erfährt. Sie 
entscheidet sich dafür, allein zu sein, anstatt mit jemandem zusammen zu 
bleiben, der sie betrogen hat. Dieser Bruch verlangt von ihr emotionale Stär- 
ke und Selbstvertrauen, obwohl sie die Entscheidung nicht rational und nach 
langer Überlegung, sondern emotional und impulsiv trifft. 

Die „angeknackste“ Beziehung ist zu Ende, der Mann verloren. Die Frau 
reagiert zunächst mit Flucht und landet dabei nur wenige Momente später in 
einem Nachtklub. Dort erfasst sie der Blick eines türkischen Sängers, der — 
im Gegensatz zur „türkischen“ Version von „Araba“ — in dieser Geschichte 
einen aktiven Part einnimmt. Die Frau läuft zur Toilette, nimmt ihren Schal 
ab und wischt sich die Tränen weg. Dann rückt sie ihr Dekolleté zurecht, 
öffnet ihre Haare und betritt die Nachtklubszene erneut. Ihr helles Kleid und 
die helle Haut heben sich von der dunklen Umgebung der Bar und der Klei- 
dung der anderen ab. Es hat den Anschein, als wolle sie sich an ihrem Ex- 
freund rächen und den türkischen Sänger für ein sexuelles Abenteuer gewin- 
nen. Der ist zwar von ihr angezogen, bleibt aber seiner Partnerin treu; sodass 
die Frau ihn nur aus der Ferne beobachten kann und akzeptieren muss, dass 
er nicht zu haben ist. Dennoch scheint sie im Musikvideo durch die Vorstel- 
lung beruhigt zu werden, dass es möglich ist, einen anderen Menschen zu 
lieben und von dieser Person geliebt zu werden. Indem sie sich mit einer 
platonischen Beziehung zu dem türkischen Sänger zufriedengibt, kann die 
Frau ihr ursprüngliches Bedürfnis, sich an ihrem Exfreund zu rächen, über- 
winden. Am Ende fühlt sie sich wohl damit, allein zu sein, und kann die 
Atmosphäre des Nachtklubs einfach genießen. Die Anziehung zwischen dem 
türkischen Sänger und der Frau bleibt bestehen, als sich ihre Blicke ein letz- 
tes Mal treffen, bevor sie die Augen und damit dieses Kapitel in ihrem Leben 
schließt. 

Die Möglichkeiten der psychischen Heilung, die in der „Araba“-Version 
für den internationalen Markt entwickelt wird, ist, dass Frauen, deren Partner 
untreu sind, die Entscheidung treffen sollten, ihre Beziehung zu beenden. Sie 
sollten sich auf sich selbst besinnen und sich auf die Jagd nach ihrem nächs- 
ten Partner begeben, indem sie ihre sexuellen Reize zur Schau stellen. Nach 
stereotypen Alltagsvorstellungen gelten türkische Männer immer noch als 
Garanten für unverbindliche sexuelle Abenteuer, verbunden mit der Auf- 
dringlichkeit „enttäuschte“ Frauen zu trösten. Der türkische Sänger verhält 
sich in dieser Hinsicht nicht stereotyp, da er seiner Freundin treu bleibt. Dies 
veranschaulicht, dass die „Araba“-Version für den internationalen Markt 
aktiv das Thema der nationalen Herkunft oder des kulturellen Hintergrundes 
adressiert, was in der Version für den türkischen Markt nicht der Fall war. 
Dies kann möglicherweise auch erklären, warum sich die sexuelle Spannung 
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am Ende wieder löst. Im Wesentlichen sagt das Video aus, dass es als Ant- 
wort auf einen Vertrauensbruch akzeptabel ist, die eigenen sexuellen Hem- 
mungen kurzzeitig zu überwinden. Letzten Endes kann Untreue aber dennoch 
nur durch Treue wieder „repariert“ werden. 


10.4 Zusammenfassung 


Auf den ersten Blick erscheint die Frau in der „Araba“-Version für den inter- 
nationalen Markt weit selbstbewusster als die Frau im Video für den türki- 
schen Markt. Dies ist großteils dem Umstand zu verdanken, dass es ihr mög- 
lich ist, aktiv einen biografischen Bruch in ihrem eigenen Leben herbei- 
zuführen. Sie verlässt ihren untreuen Partner, ist auf Rache aus und strebt 
nach sexualisierter „Reparatur“ der erlebten Verletzung. Das Video verleiht 
der Frau die moralische Legitimation dazu, Gleiches mit Gleichem zu vergel- 
ten. Sie hat sich aus einer männlichen Demütigung befreit und hat nun allen 
Grund den Spieß umzudrehen. Ein sexuelles Abenteuer mit dem nächstbesten 
Fremden im Nachtklub scheint unvermeidlich. Im Video regt der exotische 
Türke, der Sänger Mustafa Sandal, den sexuellen Appetit der Frau an. Doch 
er ist überraschend zurückhaltend und lässt sich am Ende nicht mit ihr ein. 
Schließlich fügt sie sich der Situation und sublimiert ihr Begehren im Tanz. 

Im Vergleich dazu ist ein Beziehungsabbruch in im Video für den türki- 
schen Markt weder für die Frau noch für den Mann/die Männer eine Option; 
ebenso wenig werden Horizonte von Rache oder Sexualisierung aufgeworfen. 
Von signifikantem Stellenwert für die Frau im Video für den türkischen 
Markt ist jedoch die Rivalität zweier Männer bzw. zweier konträrer Seiten 
eines Mannes, die um sie im Wettkampf buhlen. In dem Umstand, dass dieser 
Wettkampf ohne Tricks und Betrügereien abläuft, dokumentiert sich, dass 
aus moralischer Sicht Fairplay offensichtlich hohe Relevanz für die Bildpro- 
duzent/inn/en besitzt. Das Musikvideo erhält dadurch fast den Charakter 
einer guten Sportübertragung: Möge der Bessere gewinnen! Gewinner und 
Verlierer werden beide das Resultat anerkennen. Da — wie sich am Ende des 
Musikvideos herausstellt — beide Rivalen sowie der Sänger ein und dieselbe 
Person sind, beruht der dargestellte Bruch vermutlich auf der gespaltenen 
Persönlichkeit dieser facettenreichen männlichen Hauptfigur. Der hart er- 
kämpfte Sieg des einfachen Ruderers stellt damit auch eine Integration seiner 
Persönlichkeit(en) dar. Dies ist der Lohn für seine unnachgiebige Willens- 
stärke und Enthaltsamkeit, die er in der Abkehr von Luxus, Bequemlichkeit 
und Oberflächlichkeit aufzubringen vermag. 

Demnach dreht sich der dargestellte Ablauf der romantischen Beziehung 
in der Version für den türkischen Markt grundsätzlich um die persönliche 
Entwicklung des Mannes, während die Version für den internationalen Markt 
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die persönliche Entwicklung der Frau in den Mittelpunkt rückt. In diesem 
Zusammenhang verweist das Ergebnis der komparativen Analyse auf kultur- 
und geschlechtsspezifische Besonderheiten. In beiden Versionen des Mu- 
sikvideos „Araba“ besteht ein prinzipieller Bruch in der Persönlichkeit des 
Mannes. In der Version für den türkischen Markt wird dieser offen nach 
außen getragen und in Form und Ästhetik der Parallelmontage komplementä- 
rer Einstellungen gestalterisch umgesetzt. Erst am Ende des Videos lösen 
sich die Farbkontraste und Rivalitäten auf, nachdem der männliche Protago- 
nist zu sich selbst und seiner Frau gefunden hat. 

In der Version für den internationalen Markt hingegen ist der männliche 
Persönlichkeitsbruch formal unaufällig und im Wesentlichen unsichtbar. Er 
wird nur ex negativo durch den Auftritt der weiblichen Nebenbuhlerin evi- 
dent. Formale Konsequenzen für Bildgestaltung und Montage hat dabei nicht 
dieser Bruch an sich, sondern erst die aktive Entscheidung der betrogenen 
Hauptakteurin, die Szene zu verlassen. In diesem Sinne haben wir es in der 
internationalen Version des Videos mit einem impulsiven und selbstindu- 
zierten Bruch der Frau zu tun. Diese hätte schließlich auch sitzen bleiben und 
die unerfreuliche Angelegenheit mit ihrem Freund bzw. Mann in Ruhe be- 
sprechen können. In der internationalen Version wird die „Reparatur“ des 
selbstinduzierten Bruchs der Frau als impulsive und persönliche Angele- 
genheit dargestellt. Damit sind Gelüsten nach Rache und ungehemmter Sexu- 
alität als notwendige Übergangsstadien verbunden. 

Während der psychische Konflikt im Video für den internationalen 
Markt eine intrapsychische Angelegenheit der Frau darstellt, ist er in der 
Version für den türkischen Markt als männlicher Konkurrenzkampf externa- 
lisiert. In der internationalen Version wird der Bruch der Beziehung als dra- 
matischer und existenzieller Moment mit unsicherem Ausgang dargestellt. In 
der türkischen Version ist der Bruch der männlichen Persönlichkeit als zu- 
grundegelegte Vorbedingung des Videos angelegt, dessen „Reparatur“ nur 
eine Frage der Zeit ist: Derjenige, der zuerst bei der Frau ankommt, entschei- 
det den Wettbewerb. Die Beziehung ist dabei aber niemals wirklich bedroht; 
sie wird in jedem Fall gerettet. 

Wie durch die komparative Videointerpretation der türkischen und inter- 
nationalen Version des Musikvideos ,,Araba“ gezeigt werden konnte, sind 
biografische Brüche und ihre Reparaturformen nicht universell, sondern 
verweisen jeweils auf einen soziohistorischen Kontext vermittelter Praktiken 
und habitueller Orientierungen. Unter Verwendung von Bourdieus Konzep- 
tualisierung der strukturierenden Strukturen (1984) können beliebte Mu- 
sikvideos sowohl als Dokumente als auch als Ursachen kultureller Praktiken 
angesehen werden: Auf der einen Seite müssen Musikvideos an die täglichen 
Lebensereignisse ihrer Rezipient/inn/en anknüpfen, um innerhalb von deren 
Relevanzsystemen verstanden zu werden. Auf der anderen Seite müssen 
Musikvideos auch die reine Wiedergabe des Alltagslebens überschreiten, um 
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aus diesem herauszuragen und Popularität zu erlangen. Dazu müssen Mu- 
sikvideos vereinfachen und idealisieren. Im Mechanismus ihrer wechselseiti- 
gen Abhängigkeit moderieren Medien und Alltagspraktiken gemeinsam die 
Selbstkonzepte und Gewohnheiten der involvierten Rezipient/inn/en bzw. 
Medienkulturen. Latour (1996) beschreibt diese reziproke Beziehung zwi- 
schen Medien und Alltagspraktiken mit dem Konzept der Artikulation. Laut 
Sloterdijk (2004) bildet die Artikulation „den bewegten Horizont aller ‚Vor- 
schläge‘, in denen mögliches und wirkliches Seiendes sich in propositioneller 
oder provokativer Weise dem menschlichen Bemerken anbietet“ (2004, 
S. 219). Anders gesprochen, können Artikulationen auch wie Falten im Stoff 
der menschlichen Existenz aufgefasst werden. Ihr Inhalt kann niemals als 
Ganzes expliziert werden, sondern immer nur lokal durch das Entfernen einer 
bestimmten Falte (Sloterdijk, 2004, S. 220). Die vorliegende Interpretation 
der beiden Musikvideoversionen von „Araba“ kann als Beispiel einer kultur- 
und medienpsychologischen Explikation verstanden werden. In diesem Sinne 
können populäre Alltagsmedien wie Musikvideos auch als Katalysatoren von 
Artikulationsprozessen angesehen werden. Sie bieten sich ihren Nut- 
zer/inne/n nicht nur als reine Unterhaltungsinhalte, sondern auch als Mittel 
der Kommunikation über zentrale Fragen des Lebens an. 
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Abbildung 70: „Die Freilegung eines bedeutenden Mosaiks in der Türkei, Sommer 
2012“, Quelle: http://newsroom.unl.edu/releases/2012/09/18/UNL+archaeological+ 
teamtunearths+gianttRoman+mosaictin+southern+Turkey 


Die Arbeit von rekonstruktiven Sozialforscher/inne/n ist durchaus mit jener von Ar- 
chäolog/inn/en vergleichbar. Letztlich geht es ja bei der Interpretation von Kulturdo- 
kumenten (seien dies nun Texte, Bilder oder Videos) um die ,,Freilegung“ der darin 
enthaltenen Sinnstrukturen. In miihevoller Kleinarbeit miissen viele kleine ,,Stein- 
chen“ von darüber- oder darunterliegenden „Sandschichten“ (soil) unterschieden 
werden, bis das Mosaik beginnt als Ganzes sichtbar zu werden. In diesem Sinne kann 
Abb. 70 also durchaus als fokussierte bildliche Metapher der Forschungspraxis aufge- 
fasst werden. Die Begeisterung über das Endergebnis der rekonstruktiven Tätigkeit 
kann in nachfolgendem Ausschnitt der Meldung des abgebildeten Fundes auf der 
Homepage der University of Nebraska-Lincoln nachgelesen werden. Eine bemer- 
kenswerte inhaltliche Parallele zwischen Abb. 70 und der vorliegenden Arbeit ist 
natürlich der Türkeibezug. 


“A University of Nebraska-Lincoln archaeological team has uncovered a massive 
Roman mosaic in southern Turkey — a meticulously crafted, 1,600-square-foot work 
of decorative handiwork built during the region’s imperial zenith. It’s believed to be 
the largest mosaic of its type in the region and demonstrates the reach and cultural 
influence of the Roman Empire in the area in the third and fourth centuries A.D., said 
Michael Hoff, Hixson-Lied professor of art history at UNL and the director of the 
excavation. ... ‘We were surprised to have found a mosaic of such size and of such 
caliber in this region — it’s an area that had usually been off the radar screens of most 
ancient historians and archeologists, and suddenly this mosaic comes into view and 
causes us to change our focus about what we think (the region) was like.’ ... Ben 
Kreimer, a senior journalism major, agreed: ‘(Working on) the mosaic was great 
because the more soil you removed, the more mosaic there was,’ he said. ‘Visually, it 
was also stunning, especially once it got cleaned off. It wasn’t very deep under the 
surface of the soil, either, so ... we had to be careful not to swing the handpick too 
hard so as not to damage the priceless mosaic that lay just inches beneath us.’” (An- 
dersen & Smith, 2012) 


224 


11 Abschließende Diskussion 


Es war der Anspruch dieser Arbeit, die Leistungsfähigkeit sowie die metho- 
dologischen Erweiterungspotentiale des empirischen Verfahrens der Film- 
und Videointerpretation nach der dokumentarischen Methode anhand kon- 
kreter Fallbeispiele vorzustellen. Dabei konnte ich mich im Itten’schen Sinne 
(siehe Einleitung) über weite Strecken hinweg auf den durch meine Lehrer 
und Lehrerinnen vorbereiteten sicheren „Fahrwegen“ wissen. Außerdem war 
es mir gestattet, für mein Vorankommen deren bewährte „Wägen“, d. h. ihre 
erprobten Instrumente und Denkweisen, zu verwenden. So haben mir die 
vielfältigen Vorarbeiten anderer in vielerlei Hinsicht erspart „das Rad neu zu 
erfinden“. Ich hoffe, dass ich im Gegenzug im Rahmen dieser Arbeit einige 
Ansätze entwickeln konnte, die wiederum für andere Forscher/innen im Be- 
reich der Bild- und Videointerpretation hilfreich sind. 

Von ihrem Aufbau her ist diese Arbeit stark durch empirische Fallbei- 
spiele strukturiert, die auf anschauliche Weise praktische Erweiterungsan- 
sätze zur Methodologie der Video- und Filminterpretation nach der doku- 
mentarischen Methode vermitteln sollten. Konkrete Ansatzpunkte zur Me- 
thodologieentwicklung wurden dabei — über mehrere Kapitel verteilt — auf 
verschiedenen Ebenen vorgebracht (methodisch, technisch, metatheoretisch, 
inhaltlich etc.). In der abschließenden Betrachtung dieser Zusammenfassung 
und Diskussion möchte ich nochmals explizit den gemeinsamen Gesamtbei- 
trag der einzelnen Teile verdichten und die daraus resultierenden methodolo- 
gischen Konsequenzen aufzuzeigen. 

Das Videotranskriptionssystem MoViQ und die Transkriptionssoftware 
MoviScript können prinzipiell als technische Instrumente der Video- und 
Filminterpretation angesehen werden. Sie ermöglichen jedoch auch die Ein- 
nahme einer neuen Einstellung der Betrachter/innen zum Video- bzw. Film- 
material, die ohne diese Hilfsmittel nicht erreichbar wäre. Diese neue Per- 
spektive schafft in erste Linie einen Überblick und erlaubt es den For- 
scher/inne/n, sich ihre audiovisuellen „Fälle“ in aller Ruhe anzusehen. Im 
Gegensatz zum laufenden Videobild, das sich in einer Sequenzialität ständi- 
ger Veränderung befindet, erlaubt das Videotranskript den simultanen Zugriff 
auf die unablässig parallel ablaufenden Bild- und Tonereignisse. Dadurch 
werden zuvor verborgene Spuren des Produktionsprozesses sichtbar, die sich 
in den wechselseitigen Mustern der Bild- und Tonkomposition dokumentie- 
ren. Auf der Ebene der Einstellungen etwa lässt sich so im Falle von Fernseh- 
shows eine Hierarchie von Haupt-, Unter- und eingelagerten Sequenzen re- 
konstruieren, was wiederum auf einen bestimmten Montagestil verweist. 
Außerdem können Gesten und Gebärden als Leistungen der abgebildeten 
Bildproduzent/inn/en in ihrem Vollzug und Ablauf untersucht sowie mit 
anderen Gesten und Gebärden verglichen werden. Des Weiteren erlauben 
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Videotranskripte eine Verständigung über die an einem Video bzw. Film 
beteiligten Farben und Farbkontraste, denen zumindest in professionellen 
Produktionen eine dezidierte Hauptfunktion zur unterschwelligen Unterstüt- 
zung des intentionalen Ausdruckssinns zukommt (Frost, 2009). Wie das 
Fallbeispiel der Beyaz-Show (Kap. 6) gezeigt hat, können Videotranskripte 
auch dazu eingesetzt werden, das Verhältnis zwischen Bild- und Tondimen- 
sion systematisch zu verstehen und etwaige Diskrepanzen zwischen diesen 
Ebenen sichtbar zu machen. Im Kapitel „Istanbul Total“ werden Videotran- 
skripte auch im Rahmen von Gattungsanalysen verwendet: Durch den Ver- 
gleich von Montagemustern, die sich wie ein mosaikartiger Fingerabdruck in 
Videotranskripten dokumentieren, lassen sich Typen — d.h. Genres oder 
Gattungen — von Videos identifizieren. Damit können Videotranskripte so- 
wohl im Rahmen von Forschungswerkstätten als auch von Publikationen in 
besonderem Maße die intersubjektive Nachvollziehbarkeit der durchgeführ- 
ten Arbeits- und Interpretationsschritte verbessern. In diesem Zusammenhang 
schaffen sie verbindliche Referenzpunkte zur wissenschaftlichen Kom- 
munikation über Video- und Filmmaterial. 

Bei aller Begeisterung für die Anschauungsform der Videotranskripte 
möchte ich den Leser/inne/n an dieser Stelle jedoch nicht vorenthalten, dass 
deren Erstellung und Einsatz aus erkenntnistheoretischer Sicht auch proble- 
matisiert werden kann. Letztlich stellen Videotranskripte nicht nur For- 
schungsinstrumente, sondern zugleich auch Artefakte von For- 
scher/innen/handeln dar. Wenngleich an dieser Stelle keine elaborierte De- 
konstruktion dieses Handelns zu erwarten ist, so sei zumindest der Hinweis 
auf die weiterführende Lektüre Latours (2002) gegeben. Hinsichtlich ihrer 
medialen Möglichkeiten erinnern Videotranskripte in gewisser Weise durch- 
aus an die Setzkästen (Latour, 2002, Abb. 2.13, S. 65 und Abb. 2.14, S. 68), 
mithilfe derer Latours Urwaldforscher/innen Bodenproben aus der ganzen 
Welt miteinander vergleichen. Die durch Standardisierung angestrebte Erhö- 
hung der Vergleichbarkeit des Fallmaterials geht dabei mit dessen Dekon- 
texualisierung einher. An Latour erinnert auch der Einsatz von Farben bzw. 
Farbkontrasten, der in dieser Arbeit zu Interpretationszwecken entwickelt 
wurde. „Latours Setzkasten“ ermöglicht in Kombination mit einer standardi- 
sierten Farbkarte nämlich auch die systematische Klassifizierung der Boden- 
proben (Latour, 2002, Abb. 2.16, S. 73). Die Theorie der Farbkontraste nach 
Itten (Itten, 2000, 2010) wurde in dieser Arbeit aus mehreren Gründen einge- 
führt. Wohl am zentralsten ist dabei die Überlegung, dass die Theorie der 
Farbkontraste einen wesentlichen Beitrag zum tieferen Verständnis des „se- 
henden Sehens“ sensu Imdahl (1996) leisten kann, indem sie eine Ergänzung 
zum etablierten Feldlinienansatz darstellt. Die Rekonstruktion von Feldlinien 
war bislang die einzige Möglichkeit zur wissenschaftlichen Verständigung 
über die Bildebene der planimetrischen Komposition, die für die Interpretati- 
on der Ikonik, d. h. des bildlichen Dokumentsinns, von maßgeblicher Bedeu- 
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tung ist. Wie anhand des Fallmaterials von „Araba“ für den türkischen Markt 
(1996) gezeigt werden konnte, kann die Interpretation der Farbkontraste in 
methodologischer Hinsicht auch zur wechselseitigen Validierung mit Feldli- 
nien eingesetzt werden. Ihr eigentliches Potential entfaltet die Farbkontrast- 
theorie aber in der Anwendung auf die Rekonstruktion der Montage. Anhand 
der Musikvideos „Araba“ (1996) und ,,Araba“ (2004) habe ich den empiri- 
schen Versuch unternommen, Einstellungswechsel als Farbwechsel aufzufas- 
sen und als solche zu interpretieren. Formal gesehen bietet jeder Einstel- 
lungswechsel den abbildenden Bildproduzent/inn/en die Möglichkeit, diesen 
durch Farbkontraste zu betonen oder durch Farbähnlichkeiten zu kaschieren. 
Damit lassen sich Farbkontraste als Funktion von Montagemustern verstehen. 
Die Eleganz dieses Ansatzes liegt in der Möglichkeit eines direkten Zugangs 
zur Rekonstruktion der Montage. Ihre semiotische Wirkungsweise kann so 
ohne Umwege über die Detailinterpretation von Einstellungen untersucht 
werden. Dieser Vorteil mag bei der Interpretation von Fernsehshows und 
vergleichbarem Videomaterial nicht allzu sehr ins Gewicht fallen, da der 
Dokumentsinn von Fernsehshows in der Regel anhand nur weniger Ein- 
zeleinstellungen bestimmbar ist. Im Gegensatz dazu stellt sich bei Musikvi- 
deos die Frage, inwieweit dem Fallmaterial ohne einen direkten Rekonstruk- 
tionsansatz hinsichtlich der Montage entsprochen werden kann. Zwar konnte 
am Fallmaterial von „Araba“ (1996) gezeigt werden, dass auf der Basis der 
bestehenden Methodologie der dokumentarischen Video- und Filminterpreta- 
tion die Interpretation von Musikvideos prinzipiell möglich ist. Die spezifi- 
sche Beschaffenheit des Fallmaterials sorgte jedoch dafür, dass bei der Aus- 
wahl der Sequenzen und Einstellungen von der konsequenten Einhaltung der 
vorgegebenen Arbeitsschritte abgewichen werden musste. Demgegenüber 
sind von der vorrangigen Interpretation von Montagemustern im Falle von 
Musikvideos (und mitunter auch weiterer Gattungen) einige Vorteile zu er- 
warten. Ein wichtiger Gedanke hierbei ist, dass ein direkter Zugang zur for- 
malen Rekonstruktion der Montage die forschungsökonomische Entwicklung 
von Interpretationsansätzen erleichtern kann. Auf der Basis dieser ersten 
empirischen Ansätze lässt sich in weiterer Folge und in methodisch kontrol- 
lierter Weise eine Auswahl repräsentativer bzw. fokussierter Einstellungen 
sowie von Fotogrammen treffen. Anschließend können die Fotogramme 
ihrerseits einer detaillierten Bildinterpretation unterzogen werden. Außerdem 
könnte durch einen direkten Zugang zur Rekonstruktion der Montage letzt- 
lich auch seitens der Psychologie sowie der Sozialwissenschaften dem film- 
wissenschaftlichen Standpunkt Rechnung getragen werden, wonach die Mon- 
tage das eigentliche Alleinstellungsmerkmal von Videos und Filmen darstellt. 
Als Vorzug des in dieser Arbeit vorgestellten Methodeninventars können 
abschließend seine Flexibilität und vielfältigen Einsatzmöglichkeiten ver- 
standen werden. So lassen sich etwa Fotogramme, die im Zuge der Rekon- 
struktion der Montage ausgewählt und aus Videotranskripten gewonnen wur- 
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den, ihrerseits wieder als Suchkriterien für eine komparative Analyse nutzen. 
Während es früher aus technologischen Gründen lediglich möglich war, nach 
(vor-)ikonografischen Kontrasten zu bestehendem Bildmaterial zu suchen, 
erlauben moderne Suchmaschinen im Internet heute auch die bildgestützte 
Suche nach Vergleichsbildern, die als planimetrische Kontraste dienen kön- 
nen. Wie der diesbezügliche Beitrag im Kapitel „Istanbul Total“ gezeigt hat, 
sind diese Verfahren nach wie vor durch den Umfang der Bilddatenbanken 
sowie teilweise durch mangelnde Transparenz hinsichtlich der bildlichen 
Auswahlkriterien der Suchanbieter begrenzt. Aus kultur- und medientheoreti- 
scher Sicht verweisen solche technologischen Möglichkeiten jedoch deutlich 
auf zukünftige Entwicklungspotentiale der Bild- und Videointerpretation 
nach der dokumentarischen Methode. Wie die in dieser Arbeit anhand von 
Fernsehshows und Musikvideos vorgestellten methodologischen Erweiterun- 
gen gezeigt haben, bewährt sich das Verfahren nicht nur zur Rekonstruktion 
des sozialen Sinns von Video- und Filmmaterial. Aufgrund ihrer besonderen 
methodologischen Orientierung an der Eigensinnigkeit der (bewegten) Bilder 
kann die dokumentarische Bild- und Videointerpretation auch als Verfahren 
zur Rekonstruktion des medialen Sinns der Bildkomposition aufgefasst wer- 
den. Will man der Behauptung des bekannten Medientheoretikers Marshall 
McLuhan (1992) Glauben schenken, so stellt das Medium die Botschaft dar. 
Die in dieser Arbeit vorgestellten methodischen Überlegungen und Instru- 
mente können als Versuch betrachtet werden, den tieferen Gehalt dieser Aus- 
sage empirisch zu überprüfen. 
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Abbildung 11: Videotranskript der Titelsequenz von „Istanbul 


Uu 
Total“ (2004) 
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Passage (oder Sequenz): |Eingangspassage 
Film (oder Video): Istanbul Total 
Dateiname: Istanbul Total.wmv 
Datum der Transkription: |03.05.2009 
Time Code: 00 - 382 
Dauer: 382 sec. 
Transkription: Stefan Hampl 
Korrektur: + 

TC 


-i = = N x 
Am i m| | auf dem Balkon unseres 


Geräusche | ( | 
TC 5 sec. 6 sec. 7 sec. 8 sec. 9 sec. 


Am | ch b 
Geräusche (Motorengeräusche)) 
TC a 12 sec. 
Am Bosporus hier geht's ins goldene Horn ja? E 
Geräusche 
TC 15 sec. 16 sec. 17 sec. 18 sec. 19 sec. 
Am l ie fahren raus ein ständiges Heckmeck ja? | und äh da drı ben kann man fantastisch = 
Geräusche 
TC 20 sec. 21 sec. 22 sec. 23 sec. 24 sec. 
Am 
Geräusche 
25 sec. 26 sec. 27 sec. 28 sec. 29 sec. 
Am esten Kirchen | äh hierin Istanbul || ähm gla'b über tausend Jahre a 
Geräusche 


Abbildung 12: Istanbul Total (1/3) 
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Passage (oder Sequenz): |Eingangspassage 
Film (oder Video): Harald Schmidt Show 
Dateiname: Harald Schmidt.avi 
Datum der Transkription: |15.06.2009 

Time Code: 00 - 69 

Dauer: 69 sec. 

Transkription: Stefan Hampl 

TC 0 sec. 


1 sec. 2 sec. 3 sec. 4 sec. 


Am Willkommen bitte um Verständnis für Sie zu Hause dass ich den Text hier aber im neuen 


oben ablese Stud 
Pmf ((verebbender Applaus)) @@ 
TC 5 sec. 6 sec. 7 sec. 8 sec. 9 sec. 


Am io läuft der Text hier oben rechts auf einem Laufband Herzlich willkomme 
Pmf @@@@ 
10 sec. 11 sec. 12 sec. 13 sec. 14 sec. 


Am n hier im wie es jetzt neu heißt off=ziell im Ersten im Palast der Republik @((ha ha ha)) 
Pmf @@ 


TC 15 sec. 16 sec. 17 sec. 18 sec. 19 sec. 


Am @ Neu aufgebaut und mich ham viele Leute heut angesimst und a 
Pmf @ 
23 sec. 24 sec. 


TC 20 sec. 21 sec. 22 sec. 


Am nge-MMSt Faxe geschrieben und auch persönlich vorbeigekommen und gefragt was is eigentlich 
und äh oben im alten Studio ich weiß es ni 


25 sec. 26 sec. 27 sec. 28 sec. 29 sec. 


TC 


Am cht aber ich habe vorhin gesehen es kam der ich glaube in unserem alten Studio genau hier in 
Möbelwagen unserm Studio vier- 


Bm ja 


Abbildung 13: Harald-Schmidt-Show 
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TC 30 sec. 31 sec. 32 sec. i 33 sec. 34 sec. 


Am | Itundäh daneben | ist der Sultanspalast dort vorne auf dieser Anhöhe | ja? und wenn ma 
Geräusche 

TC 35 sec. 36 sec. 37 sec. 38 sec. 39 sec. R 

p 2 ! i 2 
n = re = ze 5 at [ee a 4 ne a 

Am n mal auf die andere Seite rüberschaut | \ dann kann man den Bosporus entl 
Geräusche 

TC 40 sec. 41 sec. 42 sec. 43 sec. 44 sec. 


Aam | g kucken d Bosporu e || | Asien und Europa 
Geräusche 
TC 45 sec. 46 sec. 47 sec. 48 sec. 49 sec. 


Am | teinander verbindet ja? die einzige Stadt der Welt auf zwei Kontinenten 
Geräusche 
TC 50 sec. 51 sec. 52 sec. 53 sec. 54 sec. 
Am ds dav ek gel chle | 
Geräusche Ka) 
TC 55 sec. 56 sec. 57 sec. _ 58 59 
Am sieht man hier unten das sieht man das sind immer die Boote die Boote mit den kann ähm 
man das mal zeigen? die Boote mit diesen | 
Geräusche, Motorengeräusch)) 
TC 
Am 


Abbildung 14: „Istanbul Total“ (2/3) 
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Passage (oder Sequenz): |Beyoglu 
Film (oder Video): IZDF Reiselust Istanbul 
Dateiname: Reiselust.mpg 
Datum der Transkription: [25.06.2009 
Time Code: 00 - 55 
Dauer: 55 sec. 
Transkription: Stefan Hampl 
Korrektur: + 
TG O sec. 1 sec. 2 sec. 3 sec. 4 sec. 


Am Beyoglu 24 saat yasar... ((spricht auf Türkisch)) (C 

Bm Beyoglu lebt vier 

TC 5 sec. 6 sec. 7 sec. 8 sec. 9 sec. 

Am spricht weiter auf Türkisch; Lautstärke leiser geregelt)) 

Bm undzwanzig Stunden am Tag. Hier gibt es alles soziale kulturelle und 

TC 

Am 

Bm Freizeitaktivitäten eigentlich bräuchten die Leute ihr Viertel gar nicht zu verl 

TC 15 sec. 16 sec. 17 sec. 18 sec. 19 sec. 

Am 

Bm assen sie haben ja alles Kino Theater Bars Restau 
Geräusche ((Läuten)) 

TC 20 sec. 21 sec. 22 sec. 23 sec. 24 sec. 

Am 

Bm rants seit über einhundert Jahren ist Beyo 

TE 25 sec. 26 sec. 27 sec. 28 sec. 29 sec. 

Am 

Bm glu das Unterhaltungszentrum Istanbuls und der Türkei 


Abbildung 15: Reiselust Istanbul 
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TC 65 sec. 66 sec. 67 sec. 68 sec. 69 sec. 


Am gibt's auch hier den äh Spruch Nepper-Schlepper-Bauernfänger @ja@ ja und hier war vielle 
Geräusche ((Mot 

Pmf @(1)@ 

TC 70 sec. 71 sec. 72 sec. 73 sec. 74 sec. 


Am 
Fußballwochenende oder? großartige 
Geräusche orengeräusche)) 

TC 75 sec. 76 sec. 77 sec. 78 sec. 79 sec. 

Am or Auswartssieg und damit vorzeitig Meister herzlichen Glückwunsch Fenerbahce Istanbul 

TC 80 sec. 81 sec. 82 sec. 83 sec. 84 sec. 
mik: amm See 
MRA re 

Am übrigens 

Pmf Gejohle, Klats 

TC 85 sec. 86 sec. 87 sec. 88 sec. 89 sec. 

Am die Mannschaft von Christop 

Pmf chen und Pfeiffen Ve 

TC 90 sec. 91 sec. 92 sec. 93 sec. 94 sec. 

Am 

TC 95 sec. 96 sec. 97 sec. 98 sec. 99 sec. 

Am Christoph Daum ist vorzeitig Meister geworden hier in der Türkei Fenerbahce liegt übrigens drüben 


auf der asiatischen Seite 


Abbildung 16: Istanbul Total (3/3) 
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Passage (oder Sequenz): |Eingangspassage 
Film (oder Video): ITV Total 
Dateiname: ITV Total.avi 
Datum: 24.03.2010 
Time Code: 00 - 513 
Dauer: 513 sec. 
Transkription: Stefan Hampl 
Korrektur: + 
TC 


O sec. 1 sec. 2 sec. 3 sec. 4 sec. 


Erst einmal möchte ich Ihnen eine Schlagzeile zeigen vom Folgendes Sesamstraße 
heutigen Tage _ 


Am) die Sesamstraße in Afghanistan ja? || die erste Straße in Afghanistan übrigens ja? | 
Pmf @ @ 
TC 


15 sec. 16 sec. 17 sec. 18 sec. 19 sec. 


Am und die habn ja@haha@ da sehn die Kinder Bildungsfernsehe 
Pmf 
TC 24 sec. 


20 sec. 21 sec. 22 sec. 23 sec. 


Amin [ ja da sehn die Kinder dann auch Graf Zahl | Ja? | wie=ersagt | eins | 


TC 25 sec. 26 sec. 27 sec. 28 sec. 29 sec. 


| d nachladen ja? 7 \ 
Pmf l @@@ | 


Abbildung 17: TV Total 
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Abbildung 18: Ergebnis einer textgebundenen Bildersuche. Parallelprojektion 
des Ausgangsbilds auf der linken Seite mit zwei Bildern, die anhand voriko- 
nografischer Suchkriterien („Mann, Meer und Balkon“) gefunden wurden. 


Abbildung 19: Ergebnis einer bildgebundenen Suche. Parallelprojektion des 
Ausgangsbilds auf der linken Seite mit zwei Bildern, die eine ähnliche pla- 
nimetrische Komposition aufweisen. 


TC 0 sec. 5 sec. 12 sec./44 sec. 24 sec./36sec. 79 sec. 
N 
= ER 
z i 
= Po 
Am| „Ich befinde mich“ „wie man Sehen „Asien und Europa“ „ältesten Kirchen"/ Fenerbahce 
kann „die andere Seite‘ Istanbul 


Abbildung 20: Einstellungsvariation von „Istanbul Total“ 


Abbildung 21: v.l.n.r. Fotogramm 0 sec., Tagesschau, Urlaubsfoto. 
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Abbildung 22: v.l.n.r. Fotogramm 5, Menschen vor/auf Wohnhaus, Ho- 
telanlage. 


Abbildung 23: v.l.n.r. Fotogramm 12 bzw. 44, Hügelketten im Dunst, Wind- 
surfer am Meer. 


Abbildung 25: v.l.n.r. Fotogramm 79, Taj Mahal in Indien, Jesusdarstellung 
von Giotto. Quelle: images.google.com 
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weiß nicht wer schon mal auch in Istanbul war von Ihnen ich kann wenn Sie hier kriegen Sie 
Ihnen nur empfehlen fahren Sie hier hin einfach alles 


130 sec. 131 sec. 132 sec. 133 sec. 134 sec. 
=» = a" 


Am überall Handler auf der Straße die die Jacke sagn sag mal brauchst du zwölf Punkte für 
aufmachen so Max ja? 
TC 135 sec. 136 sec. 137 sec. 138 sec. 139 sec. 
i E p ov p u j B | ao i 


TU Pe 


Am isch habbe dabei hier und ähh fantastisch wir ham ne Schifffahrt gemacht 


Pmf @(.)@ 


Abbildung 26: Sequenz ,,Jacke aufmachen“ 


C(ora) D(aniel) _ 


Abbildung 27: Vergleichsbilder „Jacke aufmachen“ 
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Passage (oder Sequenz): | Eingangspassage 

Film (oder Video): Araba“ (1996) für den türkischen Markt 
Dateiname oder URL: http://\www.youtube.com/watch?v=b0Om8YPF3N70 
Time Code: 0-39 


Dauer: 0:40 min. 
Transkription: Stefan Hampl 
Korrektur Stefan Hampl 


a 1 sec. 


Text 
Te 


Text 
Te 


Text 
Te 


Text 
Te 


Text 
Tc 


Text 
Te 


Text 


Text 


Abbildung 55: MoViQ-Videotranskript des Musikvideos „Araba“ (1996) 
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- EEE > 
Bu klip www.remixland.de tarafindan Minul 


Abbildung 57: Fotogramms 16 mit Feldlinien 


Horizontlinie/Aufnahmehöhe der Kamera FP1 


€ FP2 


me N 
Bu klip www.remixland.de tarafindan $unui 


Abbildung 58: Fotogramm 16 mit perspektivischen Linien 
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Horizontlinie 
entsprechend 
Kamerahaltung == 
Urspriingliche ” 
rekonstruierbare 
Horizontlinie 
(ca. 10° Differenz) 


Abbildung 63: Kompositionsvariation von Fotogramm 18 
(Das Bild wurde um ca. zehn Grad in die Horizontale zurückgedreht; feh- 


lende Bildteile wurden ergänzt.) 
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(Mandl 


i 


Abbildung 65: Fotogramm 6 mit Feldlinien 
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A 


Bu SA oA 
Bu klip www.remixland.de tarafindan Sunuld.de tarafindan sunulmustur captured 4 


& encoded by Mr_Stop. 


A 


€ 
a 
captured 


Abbildung 66: Farbverhältnisse der durch die Montage verbundenen Se- 
quenzen „Ferrari“, „Ruderer“ und „Sänger“ 
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Passage (oder Sequenz): Eingangspassage 

Film (oder Video): „Araba“ (2004) für den internationalen Markt 
Dateiname: http://www. youtube.com/watch?v=QIvPQbYKLww 
Datum: 2004 

Time Code: 0-233 

Dauer: 3:53 Min. 

Transkription: Stefan Hampl 


2° 0 sec. 1 sec. 


10 sec. 


Text 
Te 


Text 
Te 


Text 
Te 


Text 
Te 


Text 
ze 


Text 
Te 


Text 
Te 


Text 


Abbildung 69: Videotranskript von „Araba“ (2004), Universal Music Group 
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